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(54) Title: SYNTI IETIC SPIDER SILK PROTEINS AND THE EXPRESSION TI TEREOE IN TRANSGENIC PLANTS 

(54) Bezeichiiung: SYNTI IETLSCHE SPINNENSEIDENPROTEINE UND DEREN EXPRESSION IN TRANSGENEN PFLAN- 
ZEN 

(57) Abstract: The invention relates to a DNA sequence coding for a synthetic protein, and recombinant spider silk proteins which 
are coded by the inventive DNA sequence. The invention also relates to methods for producing plants or plant cells containing the 
recombinant spider silk protein, and transgenic plants and cells containing a DNA sequence coding for a synthetic spider protein. 
The invention further relates to a method Tor obtaining a vegetable spider silk protein from transgenic plants, in addition to vegetable 
spider silk proteins produced according to said method. 

(57) Zusaminenfassuug: Die Erfindung bctrifft cine DNA-Sequcnz, die fur cin synihctischcs Spinncnseidcnprotcin kodicrt, rc- 
kombinante Spinnenseidcnprolcinc, die durch die crllndungsgc masse DNA-Sequcnz kodicrt sind, Verfahrcn zur llcrstcllung von 
Pflanzcn bzw. Pflunzen/cllcn, die rckonibinanlcs Spinncnseidcnprotcin enihalien sowie transgene Pflanzcnzellcn und Pflanzcn, die 
cine DNA-Sequcnz cnthalten. die flir cin synihctischcs Spinncnseidcnprotcin kodien. Des weitcren bctrilTt die Erfindung ein Ver- 
fahrcn zur Gewinnung von pflanzlichcm Spinncnseidcnprotcin aus transgencn Pflanzcn sowie pflanzliche Spinncnscidcnproteine, 
die nach cinem derartigen Verfahrcn hcrgestcllt worden sind. 
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Synthetische Spinnenseidenproteine und deren Expression in transgenen Pflanzen 



5 Die Erfindung betrifft eine DNA-Sequenz, die ftir ein synthetisches 

Spinnenseidenprotein kodiert, rekombinante Spinnenseidenproteine, die durch die 
erfindungsgemafle DNA-Sequenz kodiert sind, Verfahren zur Herstellung von 
Pflanzen bzw. Pflanzenzellen, die rekombinantes Spinnenseidenprotein enthalten 
sowie transgene Pflanzenzellen und Pflanzen, die eine DNA-Sequenz enthalten, die 
10 ftir ein synthetisches Spinnenseidenprotein kodiert. Des weiteren betrifft die 

Erfindung ein Verfahren zur Gewinnung von pflanzlichem Spinnenseidenprotein aus 
transgenen Pflanzen sowie pflanzliche Spinnenseidenproteine, die nach einem 
derartigen Verfahren hergestellt worden sind. 

15 Spinnenseide weist hervorragende mechanische Eigenschaften auf, die jene vieler 
bekannter natiirlicher und kunstlicher Materialien ubertrifft. Hauptbestandteile der 
Spinnenseide sind Faserproteine wie beispielsweise Fibroin aus dem Seidenspinner 
sowie Spidroin 1 und Spidroin 2 aus Nephila clavipes. Die Festigkeit und Elastizitat 
der Seide beruht auf der Gegenwart von kurzen repetitiven Aminosaure-Einheiten, 

20 die in diesen naturlichen Proteinen vorliegen. Diese mechanischen Eigenschaften 
pradestinieren die Spinnenseide fur eine Reihe von verschiedensten technischen 
Anwendungen wie beispielsweise die Herstellung von stabilen Faden bzw. Seiden. 
Ferner verfugen die Spinnenseidenfaden aufgrund ihrer proteinchemischen 
Eigenschaften iiber ein geringes imniunogenes und allergenes Potential, weshalb sich 

25 in {Combination mit den mechanischen Eigenschaften eine Anwendung in der 
Medizin beispielsweise als naturliches Garn zum Vernahen von Wunden, als 
Anheftungsflachen fiir kultivierte Zellen, als Gertiste fur kunstliche Organe und 
dergleichen anbietet 

30 Voraussetzung fur eine derartige technische bzw. medizinische Nutzung der 
Spinnenseide ist jedoch die Herstellung von SpinnenfSden bzw. 
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Spinnenseidenproteinen in groBem MaBstab. Zu diesem Zweck wurde bislang 
versucht, die fur die Produktion der Spinnenseide verantwortlichen Spidroin- bzw. 
Fibroingene in E. coli zu exprimieren. Die sich haufig wiederholenden Sequenzen in 
den entsprechenden Genen gehen jedoch bei der Reproduktion in Bakterien nach und 
5 nach verloren. Ein weiteres Problem ist die GroBe der genetischen Information, die 
fur das Bakterium zu umfangreich zu sein scheint, so daB die Spinnenseiden-Gene 
nicht immer vollstandig ausgelesen werden. 

Versuche der Expression in Hefezellen ergaben zwar stabilere und langere 
10 Seidenproteine, die Faden, die daraus gesponnen wurden, weisen jedoch nicht die 
selben vorteilhaften Eigenschaften der nattirlichen Seide auf, so daB beispielsweise 
eine medizinische Anwendung einer derart synthetisch hergestellten Seide nicht 
moglich ist. Es besteht somit ein Bedarf an synthetischen Seidenproteinen, die in 
technischem MaBstab hergestellt werden konnen und nach dem Verspinnen zu Faden 
15 mechanische Eigenschaften aufweisen, die mit jenen der nattirlichen Seide 
vergleichbar sind. 

Aufgabe der vorliegenden Erfindung ist es deshalb, DNA-Sequenzen bereitzustellen, 
die fur ein synthetisches Spinnenseidenprotein kodieren, das eine moglichst groBe 
20 Ahnlichkeit mit den bisher bekannten nattirlichen Sequenzen von Faserproteinen der 
Spinnenseide aufweist. Ferner ist es Aufgabe der vorliegenden Erfindung, ein 
Verfahren bereitzustellen, mit dem synthetische Spinnenseidenproteine in groBem 
MaBstab hergestellt werden konnen. 

25 Aufgabe der Erfindung ist es auch, DNA-Sequenzen bereitzustellen, die fur ein 
synthetisches Spinnenseidenprotein kodieren, das zwar die vorteilhaften und 
wunschenswerten Eigenschaften von nativem Spinnenseidenprotein aufweist, bei 
dem das Eigenschaftsspektrum des nativen Proteins aber zusatzlich in die eine oder 
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andere Richtung, je nach dem jeweiligen Anwendungszweck, modifiziert bzw. 
optimiert ist. 

Weitere Aufgaben der vorliegenden Erfindung ergeben sich aus der folgenden 
5 Beschreibung. 

Oben genannte Aufgaben werden durch die Merkmale der unabhangigen 
Schutzanspriiche gelost 

1 0 Vorteilhafte Ausgestaltungen sind in den Unteranspriichen definiert. 

Im Rahmen der vorliegenden Erfindung wird jetzt eine DNA-Sequenz offenbart, die 
fur ein synthetisches Faserprotein, insbesondere ein synthetisches 
Spinnenseidenprotein kodiert, das eine mindestens 80%ige, vorzugsweise mindestens 
1 5 84%ige, mehr bevorzugt mindestens 88%ige, besonders bevorzugt mindestens 
90%ige und 92%ige, am meisten bevorzugt mindestens 94%ige Homologie zu 
Spidroin- und/oder Fibroin-Proteinen, insbesondere zu dem Spidroin 1 -Protein, 
besonders bevorzugt zu dem Spidroin 1 -Protein aus Nephila clavipes aufweist. 

20 Homologie bedeutet im Rahmen dieser Erfindung Ahnlichkeit zwischen 
Aminosauresequenzen aufgrund von identischen bzw. homologen 
Aminosaurebausteinen. Welche Aminosauren als homolog anzusehen sind, ist dem 
Fachmann bekannt, z.B. (i) Isoleucin, Leucin und Valin untereinander, (ii) Asparagin 
und Glutamin, (iii) Asparaginsaure und Glutaminsaure. 

25 

Die erfindungsgemafie DNA-Sequenz ist aus Modulen aufgebaut, die eine Gruppe 
von aneinandergereihten Oligonukleotidsequenzen umfassen, wobei die 
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Oligonukleotidsequenzen jeweils fUr repetitive Einheiten aus Spidroin- und/oder 
Fibroin-Proteinen kodieren. 

Der Aufbau der erfindungsgemaBen DNA-Sequenz aus verschiedenen Modulen, 
5 welche wiederum aus unterschiedlichen, fur Spidroine bzw. Fibroine typischen 
kurzen Aminosaure-Repeats konstruiert sind, wobei sich das Prinzip der 
Aneinanderreihung der entsprechenden Oligonukleotidsequenzen bzw. der Module 
an nattirlichen Spidroin- und/oder Fibroin-Sequenzen orientiert, gewahrleistet eine 
sehr hohe Homologie zu bisher bekannten natiirlichen Spidroin- bzw. Fibroin- 
1 0 Sequenzen. Dadurch wird sichergestellt, daB die durch die erfindungsgemafle 
DNA-Sequenz kodierten Spinnenseidenproteine nach dem Verspinnen zu F&den 
hervorragende mechanische Eigenschaften beziiglich ihrer Festigkeit und Elastizitat 
aufweisen, die mit den mechanischen Eigenschaften von natiirlichen Spinnenfaden 
vergleichbar sind. 

15 

Des weiteren ermoglicht der modulartige Aufbau der erfindungsgemaflen 
DNA-Sequenz eine einfache gentechnische Modifizierung der synthetischen Gene, 
so daB Multimere von synthetischen Spinnenseidenproteinen mit beliebiger GroBe je 
nach Wunsch hergestellt werden konnen. Ferner konnen die durch die 
20 erfindungsgemafle DNA-Sequenz kodierten Spinnenseidenproteine aufgrund des 
modulartigen Aufbaus mit anderen Faserproteinsequenzen fusioniert werden. Ein 
besonderer Vorteil der erfindungsgemaBen DNA-Sequenz ist, daB sie aufgrund ihres 
modulartigen Aufbaus auf einfache Weise mit fur Reinigungselemente oder 
Loslichkeits-verandernde Peptide kodierenden Sequenzen fusioniert werden kann. 

25 

Die Erfindung betrifft auch DNA-Sequenzen, die fur ein synthetisches 
Spinnenseidenprotein kodieren und aus Modulen aufgebaut sind, die eine Gruppe 
von aneinandergereihten Oligonukleotidsequenzen umfassen, wobei die 
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Oligonukleotidsequenzen jeweils fiir repetitive Einheiten aus Spidroin-Proteinen 
kodieren und die Module in freier Weise angeordnet sind, wobei die freie Anordnung 
ermoglicht, dali das synthetische Spinnenseidenprotein ein im Vergleich zu nativem 
Spinnenseidenprotein verandertes Eigenschaftsspektrum aufweist. 

5 

Die Erfindung liefert somit erstmals die Moglichkeit, neuartige Seidenproteine auf 
der Grundlage von modular aufgebauten Seidenproteingenen zu synthetisieren, 
wobei die neuartigen Seidenproteine ein im Vergleich zu nativem Seidenprotcin 
modifiziertes Eigenschaftsspektrum aufweisen, gleichzeitig aber die wesentlichen 

1 0 Strukturdeterminanten von naturlich vorkommenden Seidenproteinen enthalten. 
Ausgehend vom Erhalt der wesentlichen strukturellen Abschnitte der natiirlichen 
Seidenproteine, die erfindungsgeraafi in neuartiger Weise miteinander kombiniert 
werden, werden synthetische Seidenproteine bereitgestellt, die bspw. hinsichtlich 
ihrer Elastizitat, ihrer ReiBfestigkeit, ihres Loslichkeitsverhalten, ihrer Hitze- und 

1 5 Saurebestandigkeit, ihres Quellungsvermogens in eine bestimmte, fur den jeweiligen 
Einsatz vorteilhafte Richtung modifiziert bzw. optimiert sind. 

So k6nnen bestimmte Anordnungen der erhaltenen synthetischen Proteine das 
erhaltene Protein fur eine bestimmten Zweck besonders geeignet machen. Alternativ 
20 kann naturlich nach einem fiir eine bestimmte Anwendung besonders geeigneten 
Protein, z.B. mit einer im Vergleich zum nativen Protein erhohten Elastizitat, 
gescreent werden. Eine erhohte Elastizitat kann z.B. dadurch erreicht werden, dafi 
gezielt mehr elastische Module anstelle von festen Modulen fur den Aufbau 
eingesetzt werden. 

25 

In jedem Fall laBt sich die Eigenschaftskombination, welche die materialtechnische 
Attraktivitiit und Nutzlichkeit der erfindungsgemaBen rekombinanten 
Spinnenseidenproteine als Werkstoff ausmacht, durch die Anordnung der Module in 
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gewiinschten Grenzen beeinflussen, ohne sich jedoch zu stark von dcm attraktiven 
Eigenschaftsspektrum des zugrunde liegenden naturlichen Proteins zu unterscheiden. 



Die Genkassette mit der hochsten Homologie zur aus dem nativen Wirt isolierten 
cDNA, SOI genannt, weist die nachfolgende {Combination der als Modul (mit 
verschiedenen Buchstaben dargestellt) bezeichneten strukturellen Abschnitte auf: 



HBCBCGDCGDCBCBBGDBC 



10 (siehe auch Abbildung 3). Im Gegensatz zu den Ansatzen im Stand der Technik in 
Bezug auf Spinnenseiden und Naturseiden ermoglicht die erfindungsgemafie Lehre 
zur Assemblierung der Genkassetten eine neuartige und gezielte Anordnung dieser 
Module in vollstandig freier Weise. Dadurch konnen vollkommen neuartige Proteine ; 
erzeugt werden, aber auch das natiirlich vorkommende Protein nachgebaut werden. 

15 Neben der oben fur die natiirlich vorkommende Sequenz gezeigten Modulabfolge 
sind damit nun auch beliebige Variationen in beliebiger Anordnung moglich, wie 
z.B. die folgenden, die jeweils Proteine mit unterschiedlichen Eigenschaften ergeben: 



20 



H n * B n * C n * D n * (H x B y ) n * (H x C y ) n * ... * (HiBjC k D,) n . 

Ausfuhrungsbeispiele fur die Mdglichkeit der Erstellung derartiger Konstruktionen 
und fur die unterschiedlichen Eigenschaften der resultierenden Proteine konnen den 
unten stehenden Beispielen entnommen werden. 



25 Zusatzlich zu den bereits genannten Eigenschaften, die modifiziert bzw. optimiert 
werden konnen, kann bspw. durch zusatzliche RGD-Sequenzen eine verstarkte 
Anheftung von Zellen erreicht werden (Massia et al. (2001) J. Biomed. Mater. Res. 
56.390-399). Weitere nutzliche Eigenschaften der synthetischen 
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Spinnenseidenproteine gemaC der Erfindung ergeben sich auch der nachfolgenden 
Beschreibung und den Beispielen. 

Bei einer besonders bevorzugten Ausfuhrungsform der vorliegenden Erfindung weist 
5 das durch die erfindungsgeraafie DNA-Sequenz kodierte Spinnenseidenprotein eine 
mindestens 84%ige, vorzugsweise mindestens 90 %ige und besonders bevorzugt 
mindestens 94 %ige Homologie zu dem Spidroin 1 -Protein aus Nephila clavipes auf. 
Spidroin 1 aus Nephila clavipes ist wesentlich am Aufbau eines mechanisch 
besonders stabilen und elastischen Tragfadens beteiligt. 

10 

Aufgrund des modulartigen Aufbaus der erfindungsgemaBen DNA-Sequenz ist die 
Konstruktion von Genen, die sehr groBe Spinnenseidenproteine kodieren, ohne 
weiteres moglich, wobei die hohe Homologie zu Spidroin- und/oder Fibroin- 
Proteinen, insbesondere zu Spidroin 1 , besonders bevorzugt zu Spidroin 1 von 

1 5 Nephila clavipes immer erhalten bleibt. Die so erzielbare GroBenverteilung der 
durch die erfindungsgemaBen DNA-Sequenzen kodierten Proteine entspricht dem 
Spektrum von Spinnenseidenproteinen, das nach der Aufiosung von natiirlicher 
Spinnenseide beobachten werden kann. Dieses identische GroBenspektrum sowie 
die hohe Sequenzhomologie definieren die erfindungsgemaBen synthetischen Gene 

20 als Gene, die fur Spinnenseidenproteine kodieren. Im Gegensatz zu natiirlicher 

Spinnenseide, die aus einem Gemisch von Spinnenseidenproteinen besteht, werden 
durch die vorliegende Erfindung Spinnenseidenprotein-Gene bereitgestellt, die mit 
hoher Homologie cine Genklasse reprasentieren und eine einfache gentechnische 
Manipulation erlauben. 

25 

Die Module zum Aufbau der erfindungsgemaBen DNA-Sequenz umfassen eine 
Gruppe von aneinandergereihten Oligonukleotidsequenzen, die vorzugsweise 
ausgewahlt sind aus der Gruppe, bestehend aus: 
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a) TATGAGCGCTCCCGGGCAGGGT; 

b) AGCTTTTAGGTACCAATATTAATCTGGCCGGCTCCACC; 

c) TATGGTCTGGGG; 

5 d) GGCCAGGGTGCTGGCCAA; 

e) GGTGCAGGAGCWGCWGCWGCWGCTGCAGGTGGA; 

f) GCCGGCCAGATTAATATTGGTACCTAAA; 

g) CTGCCCGGGAGCGCTCA; 

h) ACCACCATAACCTCC; 

10 i) AGCACCCTGGCCCCCCAG; 

j)TGCAGCWGCWGCWGCWGCTCCTGCACCTTGGCC; 

k) TATGAGATCTGGCCAAGGAGGT; 

1) TTGGCCAGATCTCA; 

m) AGTCAGGGTGCTGGTCGTGGAGGCCAA; 
1 5 n) TCCACGACCAGCACCCTGACTCCCCAG; 

o) AGTCAGGGCGCTGGTCGTGGGGGACTGGGTGGCCAA; 

p) ACCCAGTCCCCCACGACCAGCGCCCTGACTCCCCAG; 

q) CTGGGAGGGCAGGGAGCGGGCCAA; 

r) CGCTCCCTGCCCTCCCAGACCTCC; und 
20 s) Sequenzen, die zu den Sequenzen a) bis r) eine mindestens 80%ige, vorzugsweise 

mindestens 90%ige, besonders bevorzugt mindestens 94%ige Sequenzidentitat 

aufweisen. 

Die Module umfassen vorzugsweise mindestens vier Oligonukleotidsequenzen, die 
25 sich vorzugsweise unterscheiden, urn die naturlichen Spinnenseidenproteine auf 
authentische Weise nachzugestalten. Die erfindungsgemaBe DNA-Sequenz ist 
wiederum vorzugsweise aus mindestens vier der vorstehend beschriebenen Module 
aufgebaut. 
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Der Aufbau der erfindungsgemaBen DNA-Sequenz wird im folgenden beispielhaft 
dargestellt. Zunachst werden die in Abbildung 1 angegebenen Oligonukleotide 
bereitgestellt, die fur Aminosauresequenzen kodieren, die Spidroin-typischen kurzen 
5 Aminosaure-Repeats entsprechen. Diese Oligonukleotide werden durch 

gentechnische Verfahren miteinander kombiniert, wobei sich die ^Combination an der 
naturlichen Spidroin-Sequenz richtet (siehe Abbildung 2). Die so entstandenen 
Module A, B, C, D, E und F werden erneut miteinander kombiniert (siehe 
Abbildung 3). Auf diese Weise werden erfindungsgemaBe DNA-Sequenzen 
10 bereitgestellt, die auf Aminos&ureebene eine mindestens 85%ige, vorzugsweise 
mindestens 90%ige und besonders bevorzugt mindestens 94%ige Homologie zu 
Spidroin-Proteinen zeigen. 

Bei einer weiteren Ausfuhrungsform umfafit die erfindungsgemaBe DNA-Sequenz 
1 5 zusatzlich zu den vorstehend beschriebenen Modulen Nukleinsauresequenzen, die fur 
repetitive Einheiten aus Fibroin-Proteinen, vorzugsweise aus dem Fibroin-Protein 
des Seidenspinners kodieren. 

Besonders bevorzugte erfindungsgemaBe DNA-Sequenzen weisen die Sequenzen 
20 SEQ ID No. 1 9 bis 29 auf. 

ErfindungsgemaB ist es ferner tiberraschenderweise erstmals gelungen, synthetische 
Spinnenseidenproteine in transgenen Pflanzen zu erzeugen. Auf diese Weise konnen 
synthetische Spinnenseidenproteine in groBem MaBstab hergestellt werden. Um eine 
25 stabile Expression der erfindungsgemaBen DNA-Sequenz in Pflanzen zu 

gewahrleisten, wird erfindungsgemaB ein rekombinantes Nukleinsauremolekiil 
bereitgestellt, das die vorstehend beschriebene erfindungsgemaBe DNA-Sequenz 
sowie einen ubiquitar wirkenden Promotor, vorzugsweise den CaMV35S-Promotor 
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umfaBt. Die Bereitstellung des erfindungsgemaBen rekombinanten 
Nukleinsauremolekiils ermoglicht die Expression und Akkumulation von 
synthetischen Spidroin- bzw. Fibroinsequenzen in transgenen Pflanzen. 

5 Um sicherzustellen, daB die erfindungsgemafle DNA-Sequenz in geeigneten 

Kompartimenten von transgenen Pflanzen exprimiert und akkumuliert wird, umfaBt 
das erfindungsgemaBe Nukleinsauremolekiil zusatzlich zu der erfindungsgemaBen 
DNA-Sequenz und einem ubiquitar wirkenden Promotor vorzugsweise mindestens 
eine Nukleinsauresequenz, die fur ein pflanzliches Signalpeptid kodiert. 

10 

Bei einer bevorzugten Ausfuhrungsform wird als Zielkompartiment fiir die 
Expression bzw. Akkumulation des synthetischen Spinnenseidenproteins das 
endoplasmatische Retikulum (ER) ausgewalilt Dieses Kompartiment ist fur die 
stabile Akkumulation von Fremdproteinen in Pflanzen besonders geeignet. Um den 
1 5 Transport in das ER zu gewahrleisten, umfaBt das erfindungsgemafie 

Nukleinsauremolekiil bevorzugt entsprechende Signalpeptide, besonders bevorzugt 
die LeB4Sp-Sequenz. 

Die Retention im ER, falls gewunscht, wird erfindungsgemafi dadurch gewahrleistet, 
20 daB das erfindungsgemafle Nukleinsauremolekiil zusatzlich eine 

Nukleinsauresequenz umfaBt, die fur ein ER-Retentionspeptid kodiert. 
Vorzugsweise wird die Retention in ER durch die C-terminal angeftigte 
Aminosauresequenz KDEL erreicht. 

25 Ferner kann es vorteilhaft sein, die erfindungsgemafie DNA-Sequenz an der 
Plasmalemma, d.h. der Zellmembran, zu plazieren. Deshalb umfaBt das 
erfindungsgemaBe rekombinante Nukleinsauremolekiil bei einer alternativen 
Ausfuhrungsform die erfindungsgemaBe DNA-Sequenz, fiisioniert an den 
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N-Terminus einer Transmembrandomane. Vorzugsweise ist dicse 
Transmembrandomane die Transmembrandomane des PDGF-Rezeptors, die 
sogenannte HOOK-Sequenz (siehe Abbildung 4). 

5 Bei einer besondfcrs bevorzugten Ausfuhrungsform der vorliegenden Erflndung ist 
das erfindungsgemaBe Nukleinsauremolekul mit ELP's (elastin-like polypeptides) 
fusioniert. ELP's sind oligomere Repeats des Pentapeptids Val-Pro-Gly-Xaa-Gly 
(wobei Xaa jede Aminosaure aulier Prolin und vorzugsweise Gly ist) und unterliegen 
einem reversiblen inversen Temperatunibergang. Sie sind in Wasser unterhalb der 

10 inversen Ubergangstemperatur (T t ) sehr gut lOslich, unterliegend jedoch einem 

scharfen Phaseniibergang im Bereich von 2°C bis 3°C, wenn die Temperatur iiber T t 
erhoht wird, was zur Ausfallung und Aggregation des Polypeptids fuhrt. 
D. E. Meyer und A. Chilkoti, Nat. Biotech. 1999, 17, 1 1 12-1 115, haben beschrieben, 
daB ELP-Fusionen mit rekombinanten Proteinen das Loslichkeitsverhalten dieser "i 

1 5 rekombinanten Proteine bei verschiedenen Temperaturen und Konzentrationen 

gezielt verandern. Bei der vorliegenden Erfindung wird dies zur Etablierung von im 
nachfolgenden detailliert beschriebenen Reinigungsstrategien fur das durch die 
erfindungsgemafie DNA-Sequenz kodierte Spinnenseidenprotein genutzt. 
Vorzugsweise umfassen die durch die Nukleinsauresequenz in dem 

20 erfindungsgemaBen Nukleinsauremolekul kodierten ELP's von 10 bis 100 der 
vorstehend beschriebenen Pentamer-Einheiten (siehe Abbildung 5). 

Die Herstellung der vorstehend beschriebenen chimaren Genkonstrukte bzw. 
rekombinanten Nukleinsauremolekule erfolgt mittels konventioneller 
25 Klonierungstechniken (siehe beispielsweise Sambrok et al. (1989, Molecular 

Cloning: A Laboratory Manual, 2. Auflage, Cold Spring Harbour Laboratory Press, 
Cold Spring Harbour, New York). Mittels dieser gangigen molekularbiologischen 
Techniken ist es moglich, gewunschte Konstrukte fur die Transformation von 
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Pflanzen vorzubcreiten bzw. herzustellen. Die fur die gentechnische Manipulation in 
prokaryontischen Zellen iiblicherweise eingesetzten Klonierungs-, 
Mutagenisierungs-, Sequenzanalyse- und Restriktionsanalyse-Methoden sowie 
weitere biochemisch-molekularbiologische Methoden sind dem Fachmann 
5 wohlbekannt. So konnen nicht nur geeignete chimare Genkonstrukte mit der jeweils 
gewlinschten Fusion von Promoter, erfindungsgemafier DNA-Sequenz, fur ein 
pflanzliches Signalpeptid kodierender Sequenz, fur ein ER-Retentionspeptid 
kodierender Sequenz, fiir eine Transmembrandomane kodierender Sequenz und/oder 
fiir Reinigungselemente bzw. Loslichkeits-verandernde Peptide kodierenden 
10 Sequenzen hergestellt werden. Vielmehr kann der Fachmann mittels 

Routinetechniken, falls erwunscht, verschiedenartige Mutationen oder Deletionen in 
die jeweiligen Gene einfuhren. 

Die Erfindung betrifft weiterhin Vektoren und Mikroorganismen, die 
1 5 erfindungsgemaBe Nukleinsauremolekule enthalten und deren Verwendung die 

Herstellung von Pflanzenzellen bzw. Pflanzen ermoglicht, die Spinnenseidenproteine 
produzieren. Dabei handelt es sich bei den Vektoren insbesondere urn Plasmide, 
Cosmide, Viren, Bakteriophagen und andere in der Gentechnik gangige Vektoren. 
Bei den Mikroorganismen handelt es sich in erster Linie urn Bakterien, Viren, Pilze, 
20 Hefen und Algen. 

Da die erfindungsgemaBen DNA-Sequenzen aufgrund ihres repetitiven Charakters 
kaum unikale Restriktionsorte aufweisen, wurden die erfindungsgemaBen Vektoren 
bzw. die das synthetische Spinnenseidenprotein kodierenden Gene durch 
25 verschiedene Strategien entsprechend angepafit (siehe Abbildungen 6 bis 8). Bei der 
Amplifizierung der erfindungsgemaBen DNA-Sequenzen durch PGR werden 
aufgrund des extrem repetitiven Charakters der erfindungsgemaBen DNA-Sequenzen 
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vorzugsweise zunachst Oligonukleotide anligiert, welche dann als Matrizen fiir die 
nachfolgenden PCR-Reaktionen dienen (siehe Abbildung 7). 

Des weiteren wird bei der vorliegenden Erfindung ein rekombinantes 
5 Spinnenseidenprotein bereitgestellt, das durch die erfindungsgemafie DNA-Sequenz 
kodiert wird. Dieses erfindungsgemafie synthetische Spinnenseidenprotein, 
vorzugsweise .mit einem Molekulargewicht im Bereich von 10 bis 160 kDa, weist 
eine mindestens 85%ige, vorzugsweise mindestens 90%ige und besonders bevorzugt 
mindestens 94%ige Homologie zu Spidroin- und/oder Fibroin-Proteinen auf Durch 
1 0 diese hohe Homologie mit den naturlichen Faserproteinen der Spinne und des 
Seidenspinners wird gewahrleistet, dafl die herausragenden mechanischen 
Eigenschaften der naturlichen Spinnenfaden erreicht werden, wenn die 
erfindungsgemafien Proteine zu Faden gesponnen werden. 

1 5 Ferner weisen die erfindungsgemallen Proteine uberraschenderweise neuartige 
physikochemische Eigenschaften auf So bleibt die Loslichkeit dieser 
erfindungsgemafien synthetischen Faserproteine in waBrigen Losungen auch nach 
langerem Kochen aullerordentlich gut erhalten. Gemeinsam mit der ebenfalls 
auftretenden Loslichkeit in organischen Losungen und dem Fallungsverhalten bei • 

20 hohen Salzkonzentrationen konnen dicse neuen Eigenschaften der 

erfindungsgemafien synthetischen Spinnenseidenproteine somit fur die Entwicklung 
technisch durchfuhrbarer Extraktions- und Reinigungsverfahren geniitzt werden. 
Diese Eigenschaften werden noch verstarkt, wenn die erfindungsgemafien 
synthetischen Spinnenseidenproteine gezielt in bestimmten Kompartimenten, 

25 insbesondere im ER von transgenen Pflanzen akkumuliert werden. 

Beispiele fur Aminosauresequenzen der erfindungsgemafien rekombinanten 
synthetischen Spinnenseidenproteine weisen die Sequenzen SEQ ID No. 30 bis 40 
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auf. Die erfindungsgemafien Spinnenseidenproteine konnen altemativ auch nach 
chemischen, dem Fachmann bekannten Methoden synthetisiert werden, eine 
rekombinante Herstellung ist jedoch bevorzugt. 

5 Ferner betrifft die Erfindung ein Verfahren zur Herstellung von 

Spinnenseidenprotein-produzierenden Pflanzen bzw. Pflanzenzellen, umfassend die 
folgenden Schritte: 

a) Herstellung eines wie vorstehend beschriebenen erfindungsgemafien 
1 0 rekombinanten Nukleinsauremolekuls; 

b) Ubertragung des Nukleinsauremolekuls axis a) auf pflanzliche Zellen; und 

■ 

c) gegebenenfalls die Regeneration fertiler Pflanzen aus den transformierten 
1 5 Pflanzenzellen. 

Des weiteren betrifft die Erfindung Pflanzenzellen, die die erfindungsgemafien 
Nukleinsauremolekiile bzw. den erfindungsgemafien Vektor enthalten. Die 
Erfindung betrifft ferner Ernteprodukte und Vermehrungsmaterial transgener 
20 Pflanzen sowie die transgenen Pflanzen selbst, die ein erfindungsgemafies 
Nukleinsauremolekul enthalten. 

Zur Vorbereitung der Einfuhrung fremder Gene in hohere Pflanzen bzw. deren 
Zellen stehen eine grofie Anzahl von Klonierungsvektoren zur Verfugung, die ein 
25 Replikationssignal fiir E. colt und ein Markergen zur Selektion transformierter 
Bakterienzellen enthalten. Beispiele fur derartige Vektoren sind pBR322, pUC- 
Serien, M13mp-Serien, pACYC184 usw. Die gewtinschte Sequenz kann an einer 
passenden Restriktionsschnittstelle in den Vektor eingefuhrt werden. Das erhaltene 
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Plasmid wird dann fur die Transformation von E. co/i-Zellen verwendet 
Transformierte E. co//-Zellen werden in einem geeigneten Medium geziichtet und an- 
schliefiend geerntet und lysiert, und das Plasmid wird wiedergewonnen. Als 
Analysenmethode zur Charakterisierung der gewonnenen Plasmid-DNA werden im 
5 allgemeinen Restriktionsanalysen, Gelelektrophoresen und weitere biochemisch- 
raolekularbiologische Methoden eingesetzt. Nach jeder Manipulation kann die 
Plasmid-DNA gespalten und gewonnene DNA-Fragmente mit anderen DN A- 
Sequenzen verkniipft werden. 

1 0 Fur die Einfuhrung von DN A in eine pflanzliche Wirtszelle stehen eine Vielzahl von 
Techniken zur Verfiigung, wobei der Fachmann die jeweils geeignete Methode ohne 
Schwierigkeiten ermitteln kann. Diese Techniken umfassen die Transformation 
pflanzlicher Zellen mit T-DNA unter Verwendung von Agrobacterium tumefaciens 
oder Agrobacterium rhizogenes als Transformationsmedium, die Fusion von 

15 Protoplasten, die Injektion, die Elektroporation, den direkten Gentransfer isolierter 
DNA in Protoplasten, die Einbringung von DNA mittels der biolistischen Methode 
sowie weitere Moglichkeiten die bereits seit mehreren Jahren gut etabliert sind und 
zum ublichen Repertoire des Fachmanns in der pflanzlichen Molekularbiologie bzw. 
Pflanzenbiotechnologie gehoren. 

20 

Bei der Injektion und Elektroporation von DNA in Pflanzenzellen werden per se 
keine speziellen Anforderungen an die verwendeten Plasmide gestellt. Ahnliches gilt 
ftir den direkten Gentransfer. Es konnen einfache Plasmide, wie z.B. pUC-Derivate, 
verwendet werden. Sollen aber aus derartig transformierten Zellen ganze Pflanzen 
25 regeneriert werden, ist die Anwesenheit eines selektierbaren Markergens 

empfehlenswert. Dem Fachmann sind die gangigen Selektionsmarker bekannt, und 
es stellt fur ihn kein Problem dar, einen geeigneten Marker auszuwahlen. 
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Je nach Einfuhrungsmethode gewiinschter Gene in die Pflanzenzelle konnen weitere 
DNA-Sequenzen erforderlich sein. Werden z.B. fur die Transformation der 
Pflanzenzelle das Ti- oder Ri-Plasmid verwendet, so muss mindestens die rechte 
Begrenzung, haufig jedoch die rechte und linke Begrenzung der im Ti- bzw. Ri- 

5 Plasmid enthaltenen T-DNA als Flankenbereich mit den einzufuhrenden Genen 
verbunden werden. Werden fur die Transformation Agrobakterien verwendet, muss 
die einzufiihrende DNA in spezielle Plasmide kloniert werden, und zwar entweder in 
einen intermediaren oder in einen binaren Vektor. Die intermediaren Vektoren 
konnen aufgrund von Sequenzen, die homolog zu Sequenzen in der T-DNA sind, 

10 durch homologe Rekombination in das Ti- oder Ri-Plasmid der Agrobakterien 
integriert werden. Dieses enthalt aufierdem die fur den Transfer der T-DNA 
notwendige vir-Region. Intermediare Vektoren konnen nicht in Agrobakterien 
replizieren. Mittels eines Helferplasmids kann der intermediare Vektor auf 
Agrobacterium tumefaciens iibertragen werden (^Conjugation). Binare Vektoren 

15 konnen sowohl in E. coli als auch in Agrobakterien replizieren. Sie enthalteh ein 
Selektionsmarkergen und einen Linker oder Polylinker, welche von der rechten und 
linken T-DNA-Grenzregion eingerahmt werden. Sie konnen direkt in die Agro- 
bakterien transformiert werden. Das als Wirtszelle dienende Agrobakterium soli ein 
Plasmid, das eine vir-Region tragt, enthalten. Die vir-Region ist fur den Transfer der 

20 T-DNA in die Pflanzenzelle notwendig. Zusatzliche T-DNA kann vorhanden sein. 
Das derartig transformierte Agrobakterium wird zur Transformation von 
Pflanzenzellen verwendet. Die Verwendung von T-DNA fur die Transformation von 
Pflanzenzellen ist intensiv untersucht und ausreichend in allseits bekannten 
Obersichtsartikeln und Handbiichern zur Pflanzentransformation beschrieben 

25 worden. Fiir den Transfer der DNA in die Pflanzenzelle konnen Pflanzen-Explantate 
zweckmaBigerweise mit Agrobacterium tumefaciens oder Agrobacterium rhizogenes 
kultiviert werden. Aus dem infizierten Pflanzenmaterial (z.B. Blattstiicke, Stengel- 
segmente, Wurzeln, aber auch Protoplasten oder Suspensions-kultivierte Pflanzen- 
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zellen) konnen dann in einem geeigneten Medium, welches Antibiotika oder Biozide 
zur Selektion transformierter Zellen enthalten kann, wieder ganze Pflanzen 
regeneriert werden. 

5 1st die eingefuhrte DNA einmal im Genom der Pflanzenzelle integriert, so ist sie dort 
in der Regel stabil und bleibt auch in den Nachkommen der urspriinglich 

» 

transformierten Zelle erhalten. Sie enthalt normalerweise einen Selektionsmarker, ! 
der den transformierten Pflanzenzellen Resistenz gegeniiber einem Biozid oder 
einem Antibiotikum wie Kanamycin, G 41 8, Bleomycin, Hygromycin, Methotrexat, 
10 Glyphosat, Streptomycin, Sulfonylharnstoff, Gentamycin oder Phosphinotricin u.a. i i 

i 

vermittelt. Der individuell gewahlte Marker sollte daher die Selektion transformierter ■ 

I i 

Zellen gegeniiber Zellen, denen die eingefuhrte DNA fehlt, gestatten. Hierzu sind 1 » 
auch alternative Marker geeignet, wie nutretive Marker, Screeningmarker (wie GFP, [ i 

* ■ 

green fluorescent protein). Selbstverstandlich kann auch vollkommen auf Selek- ! 1 

1 5 tionsmarker verzichtet werden, was allerdings mit einem ziemlich hohen Screening- ». 1 
bedarf einhergeht. Falls markerfreie transgenen Pflanzen erwiinscht sind, stehen dem ' 

Fachmann auch Strategien zur Verfugung, die eine nachtragliche Entfemung des ' I 

Markergens erlauben, z.B. Cotransformation, Sequenz-spezifische Rekombinasen. i I 

20 Die Regeneration der transgenen Pflanzen aus transgenen Pflanzenzellen erfolgt nach 
ublichen Regenerationsmethoden unter Verwendung bekannter NShrmedien. Die so 
erhaltenen Pflanzen konnen dann mittels iiblicher Verfahren, einschlielilich 
molekularbiologischer Methoden, wie PCR, BIot-Analysen, auf Anwesenheit der 
eingefuhrten Nukleinsaure, die ein synthetisches Spinnenseidenprotein kodiert, 

25 untersucht werden. 

Bei der transgenen Pflanze bzw. der transgenen Pflanzenzelle kann es sich urn jede 
beliebige monokotyle oder dikotyle Pflanze bzw. Pflanzenzelle handeln. 
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Vorzugsweise handelt es sich um Nutzpflanzen bzw. Zellcn von Nutzpflanzen. 
Besonders bevorzugt handelt es sich um transgene Pflanzen ausgewahlt aus der 
Gruppe, bestehend aus der Tabakpflanze (Nicotiana tabacum) und der 
Kartoffelpflanze (Solanum tuberosum). 

5 

Die Expression des erfindungsgemaBen synthetischen Spinneseidenproteins in den 
erfindungsgemaBen Pflanzen bzw. in den erfindungsgemaBen Pflanzenzellen kann 
mit Hilfe herkdmmlicher molekularbiologischer und biochemischer Methoden 

nachgewiesen und verfolgt werden. Dem Fachmann sind diese Techniken bekannt 
10 und er ist problemlos in der Lage, eine geeignete Nachweismethode zu wahlen, 
beispielsweise eine Northem-Blot-Anaiyse oder eine Southern-Blot-Analyse. 

Ein Beispiel fur die Herstellung von transgenen Spinnenseidenprotein- 
produzierenden Pflanzen ist in Abbildung 9 angegeben. Die durch PCR 

1 5 amplifizierten Sequenzen konnen moglicherweise frameshift-Mutationen enthalten. 
Deshalb mtissen die erfindungsgemaBen Sequenzen vor der Erzeugung transgener 
Pflanzen ilberprtift werden. Dies kann durch Sequenzanalyse jeweils von den 
flankierenden Vektorsequenzen aus erfolgen. Langere Konstrukte iiber 1 kB konnen 
auf diese Weise nicht gepriift werden, da aufgrund der repetitiven Eigenschaften der 

20 erfindungsgemaBen DNA-Sequenzen interne Sequenzierungsprimer keine 

auswertbaren sicheren Sequenzen liefern. Aus diesem Grund wurden amplifizierte 
Spidroinsequenzen vorzugsweise in den bakteriellen Expressionsvektor pet23a 
(Novagen, Madison, USA) kloniert. Durch immunchemischen Nachweis der 
Expression konnen dann frame shift-Mutationen ausgeschlossen werden. 

25 

Die erfindungsgemaBen Nukleinsauremolekule bzw. Expressionskassetten werden 
erfindungsgemaii ublicherweise als Hindlll-Fragmente in Shuttle- Vektoren wie 
pBIN, pCB301 und/oder pGSGLUCl kloniert. Diese Shuttle-Vektoren werden 
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vorzugsweise in Agrobacterium tumefaciens transformiert. Die Transformation von 
Agrobacterium tumefaciens wird ublicherweise durch Southern-Blot- Analyse 
und/oder PCR-Screening iiberpruft. 

5 Die Erfmdung betrifft ebenfalls Vermehrungsmaterial und Ernteprodukte der 
erfindungsgemallen Pflanzen, beispielsweise Friichte, Samen, Knollen, 
Wurzelstocke, Samlinge, Stecklinge usw. 

Ferner betrifft die Erfindung ein Verfahren zur Gewinnung von pflanzlichem 
1 0 Spinnenseidenprotein, umfassend die folgenden Schritte: 

a) die Obertragung eines erfindungsgemaBen rekombinanten 
Nukleinsauremolekuls oder Vektors, der eine DNA-Sequenz erhalt, die furi - 
ein synthetisches Spinnenseidenprotein kodiert, auf Pflanzenzellen; 

15 

b) gegebenenfalls die Regeneration von Pflanzen aus den transformierten 
Pflanzenzellen; 

c) die Verarbeitung der Pflanzenzellen aus a) bzw. der Pflanzen aus b) zur 
20 Gewinnung von pflanzlichem Spinnenseidenprotein. 

Bei einem weiteren wesentlichen Aspckt der vorliegenden Erfindung werden 
Verfahren zur Gewinnung von rekombinant hergestellten Spinnenseidenproteinen 
bereitgestellt, die die Obertragung eines erfindungsgemaflen rekombinanten 
25 Nukleinsauremolekuls oder Vektors, der eine DNA-Sequenz enthalt, die fur ein 
synthetisches Spinnenseidenprotein kodiert, auf beliebige Zellen, d.h. neben 
Pflanzenzellen beispielsweise auch bakterielle oder tierische Zellen, umfassen. 
Wesentliches Merkmal bei diesen erfindungsgemafien Verfahren ist dabei der Schritt 



XSDOCrD <WO 0194393A2 I > 



WO 01/94393 



PCT/EPO 1/06586 



-20- 



der Reinigung der rekorabinant hergestellten Spinnenseidenproteine, bei dem u.a. 
deren besondere Eigenschaften hinsichtlich der Loslichkeit bei Erwarmung und/oder 
Saurezugabe ausgenutzt werden. 

5 So erfolgt bei einer Ausfuhrungsform des erfindungsgemafien Verfahrens die 
Reinigung des rekombinant hergestellten Spinnenseidenproteins durch 
Hitzebehandlung des Zellextrakts, z.B. eines Pflanzensamen-Extrakts, und 
anschlieBende Abtrennung der denaturierten zelleigenen, z.B. der pflanzeneigenen 
Proteine beispielsweise durch Zentrifugation. Dabei wird die Eigenschaft der 
10 rekombinant hergestellten Spinnenseidenproteine ausgenutzt, daJ3 sie beim Erhitzen 
von waBrigen Losungen bis zum Siedepunkt loslich bleiben. Dagegen bleiben 
beispielsweise synthetische Faserproteine der Spinne und des Seidenspinners nach 
Expression in Pichia pastor is beim Erhitzen nur bis zu einer Temperatur von 63 °C 
und dann nur fur 1 0 Minuten in Losung. 

15 

Bei einer weiteren Ausfuhrungsform des erfindungsgemaBen Verfahrens zur 
Gewinnung von rekombinant hergestellten Spinnenseidenproteinen erfolgt die 
Reinigung durch Einstellung eines sauren pH mittels Zugabe von Saure, 
vorzugsweise Salzsaure zu dem Zellextrakt, beispielsweise zu dem Pflanzenextrakt. 

20 Der saure pH, insbesondere ein pH im Bereich von 1,0 bis 4,0, besonders bevorzugt 
im Bereich von 2,5 bis 3,5, am meisten bevorzugt ein pH von 3,0, wird dabei 
vorzugsweise fur eine Dauer von mehreren Minuten, besonders bevorzugt etwa 30 
Minuten, bei einer Temperatur unterhalb Raumtemperatur, vorzugsweise etwa 4°C, 
beibehalten. Wiederum wird eine nicht zu erwartende Eigenschaft der durch das 

25 erfindungsgemalie Verfahren gewonnenen Proteine ausgenutzt, namlich daB sie beim 
Ansiiuem, insbesondere bis zu einem pH von 3,0 bei 4°C in Losung bleiben. Die 
zelleigenen, beispielsweise pflanzeneigenen Proteine fallen dagegen aus und werden 
insbesondere durch Zentrifugation abgetrennt 
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Die vorstehend beschriebenen Loslichkeitseigenschaften der nach dem 
erfindungsgemaflen Verfahren rekombinant hergestellten Spinnenseidenproteine sind 
sehr uberraschend und waren in dieser Form nicht vorhersehbar und ermoglichen 
5 eine effiziente, schnelle und kostengiinstige Reinigung bei deren Extraktion aus 
Zellen, insbesondere Pflanzenzellen. 

Bei einer weiteren Ausfiihrungsform des erfindungsgemaJten Verfahrens wird ein 
Nukleinsauremolekul auf die Zellen iibertragen, das zusatzlich eine 
Nukleinsauresequenz umfaflt, die fur ELP ! s kodiert. In diesem Fall erfolgt die 
Reinigung des rekombinant hergestellten Spinnenseidenproteins auf die folgende 
Weise: In einem ersten Schritt wird das Spinnenseiden-ELP-Fusionsprotein durch 
Hitzebehandlung des Rohextrakts angereichert. Uberraschenderweise behalten die 
Fusionsproteine dabei die auBerordentliche Loslichkeit der Spinnenseidenproteine 
bei hohen Temperaturen bei. Ein GroBteil der zelleigenen Proteine fallt bei dieser 
Temperaturerhohung aus. Im nachsten Schritt werden die Spinnenseiden-ELP- 
Fusionsproteine durch weitere Temperaturerhohung, vorzugsweise auf eine 
Temperatur von mindestens 60°C, ausgefallt. Vorzugsweise erfolgt die Ausfallung 
bei einer geeigneten Salz-Konzentration, beispielsweise einer NaCi-Konzentration 
von mindestens 0,5 M, vorzugsweise im Bereich von 1 M bis 2 M. SchlieBlich wird 
das ELP-Fragment, vorzugsweise durch Verdauung mit CNBr, abgespalten. 

Durch das vorstehend beschriebene erfindungsgemafie Verfahren zur Gewinnung 
von rekombinant hergestelltem Spinnenseidenprotein konnen die Proteine in 
25 Pflanzen zu hohen Konzentrationen, vorzugsweise bis zu einer Expressionshohe von 
etwa 4% des gesamten loslichen Proteins angereichert werden. Damit werden 
erstmals Verfahren bereitgestellt, die zur technisch realisierbaren Anreicherung von 
rekombinantem Spinnenseidenprotein verwendet werden konnen. 
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Die erfindungsgemaBen Spinnenseidenproteine konnen bei einem weiteren Aspekt 
der vorliegenden Erfindung zur Herstellung von synthetischen Faden sowie von 
Folien und Membranen verwendet werden. Insbesondere sind derartige Produkte fur 
5 raedizinische Anwendungen, insbesondere zum Vernahen von Wunden und/oder als 
Geriiste bzw. als Abdeckung fiir kiinstliche Organe, geeignet. Ferner konnen die aus 
den erfindungsgemaBen Spinnenseidenproteine hergestellten Folien und Membrane 
u.a. als Anheftungsflachen fur kultivierte Zellen sowie zur Filterung verwendet 
werden. 

10 

Die vorliegende Erfindung wird in den nachfolgenden Beispielen, die der 
Veranschaulichung der Erfindung dienen und in keiner Weise als einschrankend zu 
verstehen sind, erlautert. 

15 

Beispielc 

Beispiel 1 : Expression und stabile Akkumulation von synthetischen Faserproteinen 
der Spinne und des Seidenspinners im endoplasmatischen Retikulum von Blattern 
20 bzw. Knollen transgener Tabak- und Kartoffelpflanzen. 

In den Abbildungen 10a und b sind Aminosauresequenzen von synthetischen 
Spinnenseidenproteinen mit einer hohen Homologie zu dem Spidroin 1 -Protein aus 
Nephila clavipes dargestellt, wobei der C-terminale und nicht repetitive konstante 
25 Bereich nicht abgebildet sind. Diese synthetischen Spinnenseidenproteine bestehen 
aus Modulen, die wiederum aneinandergereihte Oligonukleotidsequenzen umfassen. 
Durch Kombination mehrerer Module wurden die verschiedenen synthetischen Gene 
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assembliert, wobei auch Mischformen mit Fibroin 1-nachempfundenen Sequenzen 
erzeugt wurden. 



In der nachfolgenden Tabelle 1 sind verschiedene Pflanzenexpressionskassetten 
5 aufgelistet, die fur verschiedene erfindungsgemaBe synthetische Faserproteine mit 
den Sequenzen SEQ ID No. 30 bis 40 kodieren. 
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Tabelle 1 



Pfl anzenex nression ^-TC a^pftp 


Aminosauren 
(mit Leadersequenz) 


LIVlwLllllWlVJ 

Molekulargewicht 
(mit 












SB1 (SEQIDNo. 19) 


Nr. 1-149 AS 


11 kDa 


Spidroin 1 


SD1 (SEQIDNo. 21) 


Nr. 2 -182 AS 


13kDa 


Spidroin 1 


SA1 (SEQ ID No. 26) 


Nr. 3-215 AS 


16 kDa 


Spidroin 1 


SE1 (SEQ ID No. 20) 


Nr. 4 - 275 AS 


20 kDa 


Spidroin 1 


SF1 (SEQIDNo. 29) 


Nr. 5 -317 AS 


24 kDa 


Spidroin 1 


SM12 (SEQ ID No. 28) 


Nr. 6 -410 AS 


31 kDa 


Spidroin 1 


SOI (SEQIDNo. 27) 


Nr. 7 - 676 AS 


52 kDa 


Spidroin 1 


SOI SMI 2 (SEQ ID No. 23) 


Nr. 8-1035 AS 


82 kDa 


Spidroin 1 


SOlSOl (SEQ ID No. 22) 


Nr. 9- 1301 AS 


102 kDa 


Spidroin 1 


SOISOISOI (SEQ ID No. 24) 


Nr. 10 -1926 AS 


151 kDa 


Spidroin 1 


FA2 (SEQ ID No. 25) 


Nr. 1 1 - 264 AS 


20 kDa 


Spidroin 1 
und Fibroin 



Durch eine N-terminale Signalpeptidsequenz und eine C-terminale 
5 ER-Retentionssequenz (KDEL) wurde der zielgerichtete Transport und die 

Akkumulation der erfindungsgemaBen Sequenzen im endoplasmatischen Retikulum 
von Zellen transgener Pflanzen erreicht Eine Nachweissequenz in Form eines 
c-myc-Tags am C-terminalen Ende der transgenen synthetischen Faserproteine 
erlaubt den Nachweis der transgenen Produkte in Pflanzenextrakten. 

0 

Die Kassetten SOI und FA2 sind beispielhaft in den Abbildungen 10a und 10b im 
Detail dargestellt. Nach demselben Aufbauprinzip wurden die 
Pflanzenexpressionskassetten SB1, SD1, SA1, SE1, SF1, SM12, S01SM12, 
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SOlSOl undSOlSOlSOl erstellt. Durch Variation der Grundmodulwieder- 
holungen entstehen synthetische Faserproteine verschiedener Aminosaureanzahl und 
entsprechend unterschiedlichen Molekulargewichts (siehe Tabelle 1). 

5 Die Abbildung 2 beschreibt schematisch den Weg zur Einstellung der oben 
genannten Konstrukte. Zur direkten Klonierung der erfindungsgemaSen 
synthetischen Faserproteingene wurden die Schnittstellen Smal und Nael eingefuhrt. 
Dazu wurde ein PCR-Produkt, welches die entsprechenden Schnittstellen enthielt, 
mit der Primerkombination 5 -pRTRA-Smal und 3-pRTRA-NotI in das Plasmid 

10 pRTRA ScFv SmalA/BamHIA ttber BamHI und NotI kloniert. Synthetische 

Faserproteingene wurden aus den Faserproteingenderivaten der Plasmide 9905 oder 
9609 in den Vektor pRTRA.7/3-Platzhalter kloniert. Durch die Wahl der 
Restriktionsendonukleaseerkennungssequenzen am 5 - und 3 f -Ende der synthetischen 
Faserproteingene (Smal und Nael) sind diese frei miteinander kombinierbar, und 

1 5 groBere Faserproteingene konnen erfmdungsgemaB in einem Klonierungsschritt 
assembliert werden. 

Auf diese Weise wurden trans gene synthetische Spinnenseidenproteine zu hohen 
Konzentrationen im endoplasmatischen Retikulum transgener Tabak- und 

20 Kartoffelpflanzen akkumuliert (siehe Abbildungen 12a und 12b). In der folgenden 
Tabelle 2 ist die raaximale Akkumulationshohe von erfindungsgemafien 
synthetischen Spinnenseidenproteinen im ER von Blattern transgener Tabak- und 
Kartoffelpflanzen dargestellt. Die Abschatzung der Anreicherung der transgenen 
synthetischen Faserproteine erfolgte iiber einen Vergleich mit transgenen 

25 rekombinanten Antikorpern, die auf identische Weise mit dem gleichen Tag versehen 
wurden. Damit wird erstmals eine Akkumuiation von Spinnenseidenproteinen in 
Pflanzen am Beispiel von Kartoffeln und Tabak beschrieben. 
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Tabelle 2 





Faserprotein 








SD1 


SM12 


SOI 


FA2 


Tabak 

Akkumulationsmenge in 
Prozent Gesamtprotein 


~ 0,5 % 


~ 0,5 % 


~ 0,5 % 


♦ 

~ 0,5 % 


Kartoffel 

Akkumulationsmenge in 
Prozent Gesamtprotein 


~ 0,5 % 


~ 0,5 % 


~ 0,5 % 


~ 0,5 % 



5 Eine definierte Menge des faserproteinhaltigen Gesamtproteinextrakts (40 jag) und 
eine definierte Menge eines Referenzproteins mit c-myc-Immunotag (50 ng ScFv) 
wurden mittels SDS-Gelelektrophorese aufgetrennt, und synthetische Faserproteine 
und Referenzproteine wurden im Western Blot durch einen Anti-c-myc-Antikorper 
nachgewiesen (siehe Abbildungen 12 und 13). Die prozentualen Angaben resultieren 

1 0 aus dem Vergleich zwischen der Bandenintensitat der Referenzproteine und der 
Bandenintensitat der synthetischen erfindungsgemaBen Spinnenseidenproteine und 
stellen geschatzte Werte dar. GroBenunterschiede der synthetischen Faserproteine 
und des Referenzproteins wurden beriicksichtigt. Mogliche Unterschiede in der 
Markierungseffizienz konnen nahezu ausgeschlossen werden. 

15 

In Abbildung 1 3 ist die Hitzestabilitat von verschiedenen erfindungsgemaBen 
synthetischen Spinnenseidenproteinen in pflanzlichen Extrakten dargestellt. 
Uberraschenderweise bleiben die erfindungsgemaBen Spinnenseidenproteine auch 
bei einer langeren Hitzebehandlung von 3 h in Losung (V ergleich der 
20 Referenzprobe R zu den Proben H-60 min, H-120 min und H-l 80 min). Die iibrigen 
pflanzlichen Proteine werden zu mehr als 90 % denaturiert und konnen durch 
Zentrifugation einfach abgetrennt werden (Abbildung 13a: Vergleich der Probe R zu 
H-60 min). Diese ungewohnlichen Eigcnschaften der erfindungsgemaBen 



•^OOCIO <WO 0194393A2 I > 



» » 



WO 01/94393 



PCT/EP0!/W.5Kfi 



-27- 



synthetischen Spinnenseidenproteine, die unter anderem durch ihre 
Aminosauresequenz und ihre Faltung im pflanzlichen ER bedingt sind, ermoglichen 
die Entwicklung von groBtechnisch realisierbaren und kostengunstigen 
Reinigungsstrategien. 

5 

In Abbildung 14 wird die Loslichkeit von synthetischen Faserproteinen aus 
transgenen Pflanzen dargestellt. Im Gegensatz zu den im Stand der Technik 
beschriebenen bakteriell exprimierten synthetischen Faserproteinen weisen die 
erfindungsgemaflen Spinnenseidenproteine eine iiberraschend gute Loslichkeit in 
10 wafirigen Puffern auf (Rl, R2 = Tris-Puffer; Tl, T2 = Phosphatpuffer). Auch diese 
Eigenschaften beruhen unter anderem auf der Aminosauresequenz und insbesondere 
auf der Faltung im endoplasmatischen Retikulum pflanzlicher Zellen. 



1 5 Beispiel 2: Expression und stabile Akkumulation von synthetischen 

Spinnenseidenproteinen im Plasmalemma von Blattern transgener Tabak- und 
Kartoffelpflanzen. 

In diesem Beispiel wird die membranassoziierte Akkumulation von 
20 erfindungsgemafien Spinnenseidenproteinen in transgenen Tabak- und 

Kartoffelpflanzen beschrieben. Dabei wurden ausgehend von den in Beispiel 1 
beschriebenen Konstrukten Fusionsgene hergestellt, die fur ein Spinnenseidenprotein 
und fur eine Membrandomane kodieren. Das aligemeine Schema dieser 
Konstruktionen ist in Abbildung 1 5 dargestellt. Dabei wurde aus dem 
25 Plasmid pRT-HOOK ein Notl-Fragment isoliert, welches sowohl fur die HOOK- 
Domane als auch fiir einen c-myc-Immunotag kodiert, welches dann in 
Spinnenseidenproteingen-tragende Derivate des Vektors pRTA.7/3 kloniert wurde. 
Durch die Wahl der Restriktionsendonukleaseerkennungssequenzen am 5 - und 
3-Ende der synthetischen Spinnenseidenproteingene (Smal und Nael) sind diese 
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wiederum miteinander kombinierbar, wodurch groBere Faserproteingene in einem 
Klonierungsschritt assimiliert werden konnen. 

Abbildung 16 zeigt die Expression der vorstehend beschriebenen Gene in transgenen 
5 Tabak- und Kartoffelpflanzen. Wie aus dem Vergleich der Proben 1, 2 und 3 in 
dieser Abbildung ersichtlich ist, sind diese transgenen Spinnenseidenproteine im 
Gegensatz zu den im Beispiel 1 beschriebenen erfindungsgemaBen Proteinen in der 
wafirigen Phase nicht loslich. Auch diese Eigenschaft kann fur die Entwicklung von 
Reinigungsstrategien ausgenutzt werden. 

10 

Beispiel 3: Gezielte Veranderung der Loslichkeit von Spinnenseidenproteinen durch 
Fusion mit elastin-like peptides. 

15 In einem ersten Schritt wurde gezeigt, dafl Fusionen mit elastin-like peptides auch 
bei bakteriell exprimierten Spinnenseidenproteinen zu einer gezielten Veranderung 
des Loslichkeitsverhaltens in Abhangigkeit von Temperatur und Konzentration 
fuhren. 

20 Eine entsprechende Expressionskassette ist in Abbildung 5 dargestellt. Beispiele fur 
ELP mit 10, 20, 30, 40, 60, 70 und 100 Pentamereinheiten sind in den Sequenzen 
SEQ ID No. 41 bis 47 angegeben. Beispiele fur DNA-Sequenzen und 
Aminosauresequenzen in Form des Konstrukts SM12-70xELP als 
Pflanzenexpressionskassette bzw. als Expressionskassette fur E. coli sind in den 

25 Sequenzen SEQ ID No. 48-51 bzw. in den Abbildungen 19 bis 22 angegeben. 

In Abbildung 1 7 wird die gelelektrophoretische Analyse eines solchen 
Reinigungsverfahrens dargestellt. Durch Hitzebehandlung des Rohextrakts wurde 
das Spinnenseiden-ELP-Fusionsprotein angereichert. Uberraschenderweise 
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behielten die Fusionsproteine die auflerordentliche Loslichkeit der 
Spinnenseidenproteine bei hohen Temperaturen bei. Ein GroBteil der E. coli- 
Proteine wurde bei diesen Temperaturen ausgefallt. 

5 Nach starker Konzentration des angereicherten Spinnenseidenproteinextrakts wurde 
das Extrakt einer Temperatur von 60°C ausgesetzt, woraufhin das 
ELP-Spinnenseidenprotein ausfiel und pelletiert wurde. Das Pellet wurde bei 
Raumtemperatur in Wasser gelost, und unlosliche Bestandteile wurden durch 
Pelletieren entfernt 

10 

AnschlielSend wurde die Spinnenseidenproteinfraktion lyophilisiert und durch 
Cyanbromidspaltung verdaut. Die Cyanbromidspaltung wurde durch den Methionin 
Rest zwischen dem Spinnenseidenprotein und dem ELP-Peptid ermoglicht. 

15 AnschlieBend wurde erneut lyophilisiert und in waCrigem Puffer gelost. Dann 
erfolgte eine starke Konzentration, wobei das abgespaltene ELP-Fragment 
(ELP(T-R); siehe Abbildung 2) ausfiel und durch Pelletieren entfernt wurde. Das 
Spinnenseidenprotein blieb dabei in Losung (SM12(T-R); siehe Abbildung 17). Die 
Loslichkeit blieb ftir einen lSngeren Zeitraum erhalten, bei SMI 2 bei 4°C fur 24 H. 

20 Die Identitat des auf diese Weise gereinigten Spinnenseidenproteins wurde durch 
Peptidsequenzierung des N-terminalen Endes gezeigt. 

In einem zweiten Schritt wurden Spinnenseidenproteine als ELP-Fusionen im 
endoplasmatischen Retikulum von transgenen Tabakpflanzen akkumuliert Der 
25 prinzipielle Aufbau dieser Expressionskassetten ist ebenfalls in Abbildung 5 

dargestellt. Diese Fusionsproteine mit Molekulargewichten von 35.000 Dal ton bis 
100.000 Dalton wurden samtlich in Pflanzen zu hohen Konzentrationen mit einer 
Expressionshohe von etwa 4 % des gesamt loslichen Proteins angereichert. 
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Allgemeine molekularbiologische Verfahren 

- Klonierungen : Restriktionsspaltungen wurden in 1 00 |il Endvolumen 
5 vorgenommen. Standardmaflig wurde 1 0 ng Plasmid-DNA, 1 0 u je 

Restriktionsendonuklease, 10 jil eines geeigneten Puffers (lOx) eingesetzt. DNA- 
Fragmente wurden durch Gelelektrophorese voneinander getrennt und 
gegebenenfalls per DNA-Gelextraktion gereinigt. Fur Ligationen wurde das zu 
klonierende DNA-Fragment (Insert) in dreifachem molaren UberschuB zum 
1 0 Vektorfragment eingesetzt. Sticky-end Ligationen wurden in einer Stunde und 
blunt-end Ligationen in 12 h bei 4°C mit 1 u Ligase durchgefiihrt. DNA wurde 
sowohl in Zellen von E. coli als auch von A. tumefaciens durch Elektroporation 
eingebracht. Transformanten wurden auf geeigneten Nahrboden mit 
Antibiotikazusatz (Ampicillin oder Kanamycin) selektiert. 

15 

- PCR : PCR Reaktionen wurden in 50 \i\ Endvolumen vorgenommen. 
StandardmaBig wurde 100 ng Template-DNA, 100 pmol eines jeden Primer, 1 \il 
dNTP's (10 mM) und 5 |il eines geeigneten Puffers, und 1 u Tfl- oder Taq-DNA- 
Polymerase eingesetzt. Folgende Bedingungen wurden fUr eine PCR-Reaktion 

20 gewahlt: 2 min 95°C, dann 30 Zyklen a 45 sec 95°C, 45 sec 50°C oder 55°C, 1 
min 72°C, gefolgt von 5 min 72°C. 

- Expression und Akkumulation in Tabak- und Kartoffelpflanzen: Transgene 
Pflanzen wurden im Brutraum bei gieichmaCiger Beleuchtung und ca. 20°C 
25 auf geeigneten Nahrmedien mit Antibiotikazusatz (Kanamycin, Rifampicin 

und Carbenicillin) selektiert. Nach Bewurzelung wurden sie im Gewachshaus 
in erdehaltigen Topfen weiter wachsen gelassen. 
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Im ubrigen konnen die im Rahmen dieser Erfindung eingesetzten 
molekularbiologischen und biochemischen Techniken in gangigen 
Laborhandbuchern nachgeschlagen werden, wie z.B. in Sambrook et al. (1989) 
Molecular Cloning: A Laboratory Manual, 2. Auflage, Cold Spring Harbour 
5 Laboratory Press, Cold Spring Harbour, New York. 

Abbildungen 

10 Abbildung 1: 

Oligonukleotid-Sequenzen, die fur Spidroin-typische kurze Aminosaurerepeats 
kodieren. 

Abbildung 2: 

1 5 Aneinanderreihung von Oligonukleotid-Sequenzen zum Aufbau von Modulen der 
erfindungsgemafien DNA-Sequenzen. 

Abbildung 3: 

20 Aufbau der erfindungsgemafien DNA-Sequenzen aus Modulen. 
Abbildung 4: 

Klonierung des Gens der Transmembrandomane von HOOK mit Notl aus (pRT- 
HOOK) in (pRTA.73 syn.spidroin). 

25 

Abbildung 5: 

Schematische Darstellung der Spidroin-ELP-Expressionskassetten. xELP-Einheiten: 
10, 20, 30, 40, 60, 70 oder 100 Pentamere (Val-Pro-Gly-Val-Gly). Das Methionin 
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zwischen dem Spinnenseidenprotein und dem ELP-Peptid ermoglicht die 
Cyanbromidspaltung. 

Abbildung 6: 

5 Veranderung einer Base in der Erkennungssequenz von BamUl (Position 1332) 
durch gezielte Mutagenese. 

! 

Abbildung 7: 

Vorbereiten von (pRTRA.73, BamUlA) auf die direkte Klonierung der synthetischen 
1 0 Spidroingene aus p9905 oder p9609 - Aufheben der Swa I-Erkennungssequenz 
(Position 463). 

Abbildung 8: 

Einfuhrung der Restriktionserkennungssequenzen von Smal und Nael in den Vektor : 
1 5 (pRTRA.73, ZtawHIA+SmalA) fur die Klonierung synthetischer Spidroingene. 

Abbildung 9: 

Allgemeine Darstellung der Herstellung transgener Spinnseidenprotein- 
produzierender Pflanzen. 

20 

Abbildung 10: 

(a) Darstellung des modulhaften Aufbaus der erfindungsgemafien 
Spinnenseidenproteine am Beispiel der SOl-Sequenz. Aminosauren 1-28: 
LeB4-Signalpeptid; Aminosauren 29 - 659: synthetische 
25 Spinnenseidenproteinsequenz; Aminosauren 660 - 672: c-myc-Tag; Aminosauren 1 
673 - 676 ER-Retentionssignal. 
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Anordnung der Sequenzmodule nach der in Simmons et al., 1996. Molecular 
orientation and two-component nature of the cristalline fraction of spider dragline 
silk. Science 271: 84 - 87 angegebenen Originalsequenz. 

« 

5 (b) Darstellung des modulhaften Aufbaus des synthetischen 

Faserhybridproteins FA2. Aminosauren 1 - 28: LeB4-Signalpeptid; Aminosauren 
28 - 130: synthetische Faserproteinsequenz der Spinne; Aminosauren 1 3 1 - 247: 
synthetische Faserproteinsequenz des Seidenspinners; Aminosauren 248 - 260: 
c-myc-Tag; Aminosauren 261 - 264: ER-Retentionssignal. 

10 

i 

Abbildung 11: 

Schematische Darstellung der Erstellung von Genkassetten fur die Akkumulation 
von synthetischen Faserproteinen der Spinne und des Seidenspiimers im ER von 

i 

transgenen Pflanzen. ' ; 

* - • 

15 

Abbildung 12: 

(a) Expression der synthetischen Faserproteine der Spinne (SD1, SM12, SOI) bzw. 
des Hybrids aus Spinne und Seidenspinner (FA2) in Blattern von transgenen 
Tabakpflanzen. Analysiert wurden jeweils 40 jig Gesamtprotein in 

20 SDS-Probenpuffer. SD1: 13kDa; FA2: 20kDa;SM12: 31kDa;S01: 52 kDa; K: 
Positivkontrolle 50 ng ScFv. 

(b) Expression der synthetischen Faserproteine der Spinne (SD1, SM12, SOI) bzw, 
des Hybrids aus Spinne und Seidenspinner (FA2) in transgenen Kartoffelpflanzen. 

25 

Analysiert wurden ebenfalls jeweils 40 jig Gesamtprotein in SDS-Probenpuffer. 
SD1: 13 kDa; FA2: 20kDa;SM12: 31kDa;S01: 52 kDa; K: Positivkontrolle 
50 ng ScFv. 
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Abbildung 13: 

Darstellung der Hitzebestandigkeit der synthetischen Faserproteine der Spinne und 
des Seidenspinners anhand derKonstrukte SD1 undFA2. A: Coomassie-gefarbtes 
5 Gel. B: Immunochemischer Nachweis der synthetischen Faserproteine SD1 und 
FA2 mittels Anti-c-myc-Antik5rper. PM: Proteinmarker; ScFv: 50ngScFv;R: 
w&Briges Pflanzenextrakt von Blattern von transgenen Pflanzen fur SD1 und FA2; H: 
Hitzeschritt 60 min, 120 min, 180 min, 24 H und 48 H bei 90°C. 

10 Bei der Hitzebehandlung ausgefallene Pflanzenextraktbestandteile wurden durch 
Zentrifugieren abgetrennt. 

Abbildung 14: 

Untersuchung der Losungseigenschaften xuid Stabilitat des synthetischen 
IS Spinnenseidenproteins SOI nach Ammoniumsulfatfallung. 

10 g Blattmaterial wurden in Stickstoff schockgefroren, zermorsert, in 20 ml 
Rohextraktpuffer aufgenommen, fiir 30 min bei 38°C geschiittelt, und unlosliche 
Bestandteile wurden durch Zentrifugieren entfernt (30 min, 10.000 rpm). 

20 AnschlieBend wurde der Uberstand (R) fiir 10 min auf 90°C erhitzt und das 

Prazipitat durch Zentrifugieren entfernt (30 min, 10.000 rpm). Der Oberstand (H) 
wurde mit 20 % Ammoniumsulfat versetzt, 4 h bei Raumtemperatur gerollt und das 
Prazipitat durch Zentrifugieren fur 60 min bei 4000 rpm und 4°C entfernt. Der 
Uberstand wurde auf 30 % Endkonzentration Ammoniumsulfat eingestellt und tiber 

25 Nacht bei Raumtemperatur gerollt. Die Losung wurde in 5 Aliquote getrennt imd 
das Prazipitat durch Zentrifugieren entfernt (60 min, 4000 rpm, 4°C). Die 

** 

Uberstande wurden verworfen und die verbliebenen Pellets in folgenden Losungen 
aufgenommen: Rl: Rohextraktpuffer (50 mM Tris/HCl pH 8,0; 100 mM NaCl, 
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IO mM MgS0 4 ); S: SDS-Probenpuffer; G: 0,1 M Phosphatpuffer, 0,01 M Tris/HCl, 
6 M Guanidiniumhydrochlorid/HCl pH 6,5; T: 1 x PBS, 1 % TritonX-100; L: LiBr. 

Die Ansatze wurden fiir 1 h bei 37°C geschuttelt, und durch Zentrifugieren wurden 
5 unlosliche Bestandteile entfernt (30 min, 10.000 rpm). AnschlieJJend wurde ein 
Aliquot jedes Ansatzes entnommen und fur die SDS-Gelelektrophorese vorbereitet 
(Rl, SI, Gl, Tl, LI). Die Ansatze wurden nun 36 h bei Raumtemperatur stehen 
gelassen, Durch Zentrifugieren wurden unlosliche Bestandteile entfernt (30 rain, 
10.000 rpm). Wiederum wurde ein Aliquot jedes Ansatzes entnommen und fur die 
10 SDS-Gelelektrophorese vorbereitet (R2, S2, G2, T2, L2). Es wurden jeweils 
vergleichbare Volumina analysiert. 

Abbildung 15: 

Schematische Darstellung der Konstruktion von Genkassetten fur die Akkumulation 
15 von Plasmalemma-standigen synthetischen Faserproteinen der Spinne und des 
Seidenspinners in transgenen Pflanzen. 

Abbildung 16: 

Expression der Faserfusionsproteine SM12-HOOK, SOl-HOOK und FA2-HOOK in 
20 Blattern von transgenen Kartoffelpflanzen. 

Abbildung 17: 

Gelelektrophoretische Analyse der Anreicherung von bakteriell exprimierten 
Spinnenseidenproteinen nach Fusion mit ELP's. Spinnenseidenprotein: 
25 30.000 Dalton. 

Abbildung 18: 
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Western Blot- Analyse der Expression von Spinnenseiden-ELP-Fusionsproteinen in 
transgenen Tabakpflanzen. Jeweils 2,5 \xg Gesamtpflanzenprotein wurden getrennt 
und die Spinnenseidenproteine auf dem Western Blot durch ECL nachgewiesen. 
Durch Vergleich mit dem Standard wird die Spinnenseidenproteinkonzentration auf 
5 mindestens 4 % des gesamtloslichen Proteins geschatzt. 



Abbildung 19: 

DNA-Sequenz von SM12-70xELP als Pflanzenexpressionskassette. 

10 

Abbildung 20: 

Proteinsequenz von SM12-70xELP aus pflanzlicher Expression (SMI 2, c-myc-Tag, 
70xELP, KDEL - jeweils durch Absatz gekennzeichnet), 

15 Abbildung 21: 

DNA-Sequenz von SM12-70xELP als Expressionskassette fur E. coli. 

Abbildung 22: 

Proteinsequenz von SM12-70xELP aus bakterieller Expression (SM12, c-myc-Tag, 
20 70xELP, c-myc-Tag, HisTag - jeweils durch Absatz gekennzeichnet). 
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PATENTANSPRUCHE 



1 . DNA-Sequenz, die fur ein synthetisches Spinnenseidenprotein kodiert 
5 und aus Moduien aufgebaut ist, die eine Gruppe von aneinandergereihten 

Oligonukleotidsequenzen umfassen, wobei die Oligonukleotidsequenzen jeweils fur 
repetitive Einheiten aus Spidroin-Proteinen kodieren und die Module in freier Weise 
angeordnet sind, wobei die freie Anordnung ermoglicht, daB das synthetiscbe 
Spinnenseidenprotein ein im Vergleich zu nativem Spinnenseidenprotein verandertes 
10 Eigenschaftsspektrum aufweist. 

2. DNA-Sequenz nach Anspruch 1, 

dadurch gekennzeichnet, daB die Oligonukleotidsequenzen ausgewahlt sind aus der 
Gruppe, bestehend aus: 
15 a) TATGAGCGCTCCCGGGCAGGGT; 

b) AGCTTTTAGGTACCAATATTAATCTGGCCGGCTCCACC; 

c) TATGGTCTGGGG; 

d) GGCCAGGGTGCTGGCCAA; 

e) GGTGCAGGAGCWGCWGCWGCWGCTGCAGGTGGA; 
20 f) GCCGGCCAGATTAATATTGGTACCTAAA; 

g) CTGCCCGGGAGCGCTCA; 

h) ACCACCATAACCTCC; 

i) AGCACCCTGGCCCCCCAG; 

j)TGCAGCWGCWGCWGCWGCTCCTGCACCTTGGCC; 
25 k) TATGAGATCTGGCCAAGGAGGT; 
1) TTGGCCAGATCTCA; 
m) AGTCAGGGTGCTGGTCGTGGAGGCCAA; 
n) TCCACGACCAGCACCCTGACTCCCCAG; 
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o) AGTCAGGGCGCTGGTCGTGGGGGACTGGGTGGCCAA; 
p) ACCCAGTCCCCCACGACCAGCGCCCTGACTCCCCAG; 
q) CTGGGAGGGCAGGGAGCGGGCCAA; 
r) CGCTCCCTGCCCTCCCAGACCTCC; und 
5 s) Sequenzen, die zu den Sequenzen a) bis r) eine mindestens 80%ige, vorzugsweise 
mindestens 90%ige, besonders bevorzugt mindestens 94%ige, 96%ige, 98%ige 
Sequenzidentitat aufweisen. 

3. DNA-Sequenz nach Anspruch 1 oder 2, 
10 dadurch gekennzeichnet, daC die Module mindestens 4 Oligonukleotidsequenzen 
umfassen. 



4. DNA-Sequenz nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet, daii sie aus mindestens 4 Modulen aufgebaut ist. 

15 

5. DNA-Sequenz nach einem der vorangehenden Anspriiche, 

dadurch gekennzeichnet, daB sie zusatzlich Nukleinsauresequenzen umfafit, die fur 
repetitive Einheiten aus Fibroin-Proteinen, vorzugsweise aus dem Fibroin-Protein 
des Seidenspinners kodieren. 

20 

6. DNA-Sequenz nach einem der vorangehenden Anspriiche, umfassend 
eine der in SEQ ID No. 19-29 angegebenen Sequenzen. 



7. Rekombinantes Nukleinsauremolekiil, umfassend eine DNA-Sequenz 
25 nach einem der vorangehenden Anspriiche sowie einen ubiquitar wirkenden 
Promotor, vorzugsweise den CaMV 35S-Promotor. 
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8. Nukleinsauremolekiil nach Anspruch 7, zusatzlich umfassend mindestens 
eine Nukleinsauresequenz, die fur ein pflanzliches Signalpeptid kodiert. 

9. Nukleinsauremolekul nach Anspruch 8, 

5 dadurch gekennzeichnet, dafi das pflanzliche Signalpeptid den Transport in das 
endoplasmatische Retikulum (ER) gewahrleistet. 

1 0. Nukleinsauremolekul nach Anspruch 8 oder 9, 

dadurch gekennzeichnet, daJ3 die fur das pflanzliche Signalpeptid kodierende 
1 0 Nukleinsauresequenz eine LeB4Sp-Sequenz ist 

1 1 . Nukleinsauremolekul nach einem der Ansprttche 7 bis 10, zusatzlich 
umfassend eine Nukleinsauresequenz, die fiir ein ER-Retentionspeptid kodiert. 

15 12. Nukleinsauremolekiil nach Anspruch 1 1 , 

dadurch gekennzeichnet, dafi das ER-Retentionspeptid die Sequenz KDEL umfafit. 

13. Nukleinsauremolekul nach einem der Anspriiche 7 bis 10, zusatzlich 
umfassend eine Nukleinsauresequenz, die fiir eine Transmembrandomane kodiert. 

20 

14. Nukleinsauremolekul nach Anspruch 13, 
dadurch gekennzeichnet, dafi die Nukleinsauresequenz fur die 
Transmembrandomane des PDGF-Rezeptors kodiert. 

25 15. Nukleinsauremolekiil nach einem der Anspriiche 7 bis 14, zusatzlich 

umfassend eine Nukleinsauresequenz, die fur ELFs kodiert. 

16. Nukleinsauremolekiil nach Anspruch 15, 
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dadurch gekennzeichnet, dafi die ELP's von 10 bis 100 Pentamer-Einheiten 
umfassen. 

17. Nukleinsauremolekiil nach Anspruch 15 oder 16, umfassend eine der in 
5 SEQ ID No. 48 und 50 angegebenen Sequenzen. 

1 8. Vektor, umfassend ein rekombinantes Nukleinsauremolekiil nach einem 
der Anspriiche 7 bis 1 7. 

10 19. Mikroorganismus, enthaltend ein rekombinantes Nukleinsauremolekiil 

oder einen Vektor nach einem der Anspriiche 7 bis 18. 

20. Rekombinantes Spinnenseidenprotein, kodiert durch eine DNA-Sequehz 
nach einem der Anspriiche 1 bis 6. 

15 

2 1 . Spinnenseidenprotein nach Anspruch 20, 

dadurch gekennzeichnet, daB es ein Molekulargewicht im Bereich von 10 bis 160 
kDa aufweist. 

20 22. Rekombinantes Spinnenseidenprotein, umfassend eine der in SEQ ID 

No. 30 bis 40 angegebenen Aminosauresequenzen. 

23 . Verfahren zur Herstellung von Spinnenseidenprotein-produzierenden 
Pflanzen bzw. Pflanzenzellen, umfassend die folgenden Schritte: 
25 a) Herstellung eines rekombinanten Nukleinsauremolekiils nach einem der 
Anspriiche 7 bis 17; 

b) Ubertragung des Nukleinsauremolekiils aus a) auf pflanzliche Zellen; und 

c) ggf. die Regeneration fertiler Pflanzen aus den transformierten Pflanzenzellen. 
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24. Transgene Pflanzenzellen, enthaltend ein rekombinantes 
Nukleinsauremolekiil oder einen Vektor nach einem der Anspriiche 7 bis 18, oder 
hergestellt nach einem Verfahren nach Anspruch 23. 

5 

25 . Transgene Pflanzen, enthaltend eine Pflanzenzelle nach Anspruch 24 
oder hergestellt nach Anspruch 23, sowie Teile dieser Pflanzen, transgene ' 
Ernteprodukte und transgenes Vermehrungsmaterial dieser Pflanzen, wie 
Protoplasten, Pflanzenzellen, Kalli, Samen, Knollen, Stecklinge, sowie die 

1 0 transgenen Nachkommen dieser Pflanzen. 



26. Transgene Pflanzen nach Anspruch 25, ausgewahlt aus der Gruppe, 
bestehend aus Tabakpflanze und Kartoffelpflanze. 



1 5 27. Verfahren zur Gewinnung von pflanzlichem Spinnenseidenprotein, 

umfassend die folgenden Schritte: 

a) die Ubertragung eines rekombinanten Nukleinsauremolekuls oder Vektors nach 
einem der Anspriiche 7 bis 18 auf Pflanzenzellen; 

b) gegebenenfalls die Regeneration von Pflanzen aus den transformierten 
20 Pflanzenzellen; und 

c) die Verarbeitung der Pflanzenzellen aus a) bzw. der Pflanzen aus b) zur 
Gewinnung von pflanzlichem Spinnenseidenprotein. 



28. Verfahren zur Gewinnung von rekombinant hergestelltem 
25 Spinnenseidenprotein, umfassend die folgenden Schritte: 

a) die Ubertragung eines rekombinanten Nukleinsauremolekuls oder Vektors nach 
einem der Anspriiche 7 bis 18 auf Zellen; 
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b) die Reinigung des Spinnenseidenproteins durch Hitzebehandlung des Zellextrakts 
und anschlieflende Abtrennung der denaturierten zelleigenen Proteine. 

29. Verfahren zur Gewinnung von rekombinant hergestelltem 
5 Spinnenseidenprotein, nmfassend die folgenden Schritte: 

a) die Ubertragung eines rekombinanten Nukleinsauremolekiils oder Vektors nach 
einem der Anspriiche 7 bis 1 8 auf Zellen; 

b) die Reinigung des Spinnenseidenproteins durch Einstellung eines sauren pH, 
vorzugsweise eines pH im Bereich von 2,5 bis 3,5 mittels Zugabe von SSure^ 

10 vorzugsweise Salzsaure zu dem Zellextrakt und anschliefiende Abtrennung der 
denaturierten zelleigenen Proteine. 

30. Verfahren zur Gewinnung von rekombinant hergestelltem 
Spinnenseidenprotein, umfassend die folgenden Schritte: 

15 a) die Ubertragung eines rekombinanten Nukleinsauremolekiils nach einem der 
Anspriiche 15 bis 17 auf Zellen; 

b) die Reinigung des Spinnenseidenproteins auf folgende Weise: 

- Anreicherung des Spinnenseiden-ELP-Fusionsproteins durch Hitzebehandlung des 
Zellextrakts; 

20 - Ausfallung des Spinnenseiden-ELP-Fusionsproteins durch weitere 

Temperaturerhohung, vorzugsweise auf eine Temperatur von mindestens 60°C, und 
vorzugsweise bei einer Salzkonzentration von 1 M bis 2 M; und 

- Abspaltung des ELP-Fragments, vorzugsweise durch Verdauung mit CNBr. 

25 31. Verfahren nach einem der Anspriiche 28 bis 30, 

dadurch gekennzcichnet, daB die Zellen ausgewahlt werden aus Pflanzenzellen, 
tierischen Zellen und bakteriellen Zellen. 
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32. Pflanzliches Spinnenseidenprotein, hergestellt nach einem Verfahren 
nach einem der Anspriiche 27 bis 3 1 . 



33. Spinnenseidenprotein nach Anspruch 32, 
dadurch gekennzeichnet, dali es ein Molekulargewicht im Bereich vori 10 bis 160 
kDa aufweist 



34. Verwendung der Spinnenseidenproteine nach einem der Arispruche 20 
bis 22 bzw. nach Anspruch 32 oder 33 zur Herstellung von synthetische Faden, 
1 0 Folien nnd/oder Membranen. 



35. Verwendung nach Anspruch 34, wobei die Faden, Folien und/oder 
Membrane fur medizinische Anwendungen, insbesondere zum Vernahen von 
Wunden und/oder als Geriiste bzw. als Abdeckung fur kiinstliche Organe, eingesetzt 
1 5 werden. 



36. Verwendung nach Anspruch 35, wobei die Folien und/oder Membrane 
als Anheftungsflachen fur kultivierte Zellen und/oder zur Filterung verwendet 
werden. 



37. DNA-Sequenz nach einem der Anspriiche 1 bis 6 oder 
Spinnenseidenprotein nach einem der Anspriiche 20 bis 21 und 32 oder 33, wobei 
das Eigenschaftsspektrum bzgl. mindestens einer Eigenschaft, ausgewahlt aus 
ReiBfestigkeit, Elastizitat, Quellungsvermogen, Loslichkeitsverhalten, 
25 Saurestabilitat, Hitzebestandigkeit gegeniiber nativem Spinnenseidenprotein 
verandert ist. 
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Nr. des 


Scquenz in 5' to 3' Richtung 


Oligos 




1 


TATGAGCGCTCCCGGGCAGGGT 


2 


AGCTTTTAGGTACCAATATTAATCTGGCCGGCTCCACC 


3 


TATGGTCTGGGG 


4 


GGCCAGGGTGCTGGCCAA 


5 


GGTGCAGGAGGWGCWGCWGCWGCTGCAGGTGGA 


6 


GCCGGCCAGATTAATATTGGTACCTAAA 


7 


CTGCCCGGGAGCGCTCA 


8 


ACCACCATAACCTCC 


9 


AGCACCCTGGCCCCCCAG 


10 


TGCAGCWGCWGCWGCWGCTCCTGCACCTTGGCC 


11 


TATGAGATCTGGCCAAGGAGGT 


12 


TTGGCCAGATCTCA 


13 


AGTCAGGGTGCTGGTCGTGGAGGCCAA 


14 


TCCACGACCAGCACCCTGACTCCCCAG 


15 


AGTCAGGGCGCTGGTCGTGGGGGACTGGGTGGCCAA 


16 


ACCCAGTCCCCCACGACCAGCGCCCTGACTCCCCAG 


17 


CTGGGAGGGCAGGGAGCGGGCCAA 


18 


CGCTCCCTGCCCTCCCAGACCTCC 



Abb. 1 



Protein 


Anordung der Genkassettcn aus Abbildung 2 
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Abbildung 2 
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Abb. 4 

. 6. Ktonterurig des Gens der Transnwmbrandomane von HOOKmlt Nat\ aus (pRT r HOOK) in (pRTRA.73 syn. spldoin) . J 



//«dlH<5383) 35S-Promotor 




Konstruktion der binaren w«dmc2982) *»icz49t) 

Plasmide (Quelle: pBin19 und/oder mxiczsm)™* hook 

pGSGIud) mit Spidroin-HOOK 
Expresstonskassetten durch 
Transfer von Hind Nl-Fragmenten 
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Spidroin-ELP-Expressionskassetten fur Escherichia coli 



77-Promotor 



c-myc-lmmunotag His-tag 
(Met) 




xELP-Einheiten 



x = (10-100 ELP-Pentamere) 



Spidroin-ELP-Expressionskassetten fur transgene Pflanzen 



35S-Promotor ER-Signafpeptid 

\ 




c-myc-tmmunotag ER-Retentionssignal 
(Met) 



synthetisches Spidroingen 




^7 




xELP-Einheiten 



x = (10-100 ELP-Pentamere) 



Abb. 5 
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Abb. 6 

M . Verandenmg einer Base In der Eikennungssequenz von BamHI (Pos. 1332) durch gezlelte Mutagenese 
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Fragmenten 
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Abb, 7 

& Vortereite.n von (jpRTRA:,73 BamHIA) auf die direkte Wonierung der synthetischen s \. . *vj 
iSpldrolngene alls p9906 oder p9609 - Aufheben der Smal-Grkennuhgssequehz (Pos.*463) i 
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Abb. 8 

4. EinfDhning derRestrlktionsei^ennung^que^en von Sma\ undNae] In den ' : v -! 
: Vektor (pRTRA.73 BamHI+Smal' A) fUr die Wonterung synthetischer SpldroJrigene ; i 



//mi III (4234) 




35S»Promotor 
UB4SP 
~&j*HI(S44) 



S'pRTRA-Smal 
BaroHi Smal 



scFv 



^Atofl(1295) 
c-royc KOEL 
Poly A 
Mini m(\ 596) 
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Abb. 9 

S-Generelle Darstelluhg der Herstellung transgener Spidroin-produzierender Pflan2en 



1. Konstruktion geeigneter pflanzenkompatibler Spidroinexpressionskassetten in Escherichia coli 

ER-Retentionssignal 



i. t-fHi ^m^^m^mm 




35S-Promotor ER-Signalpeptld c-myc-lmmunoUg 




HOOK-Transmcmb rand omanc 

a. Oberprufung der Expressionskassetten durch Sequenzierung und/oder Testexpression im 
pet-System in Escherichia coli 

2. Einbringen der Expressionskassetten in .yAwtf/e-Vektoren (pBINl9; pGSGluc) in Escherichia coli 

3. Transformation der «s/w///e-Vektoren in Agrobactcrium tumefaciens-S&mme 
a. Uberpriifung der Klone durch Southern-Blot- Analyse 

4. Herstellung transgener Tabak- und Kartoffelpflanzen 

5. Analyse der transgenen Tabak- und Kartoffelpflanzen auf Spidroinproteinexpression durch 
inununochemische Detektion eines c-myc-Tags (Western-Analyse) 
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Abb. 10a 
LcB4-Signalpcpcid 

MASKPFLSL 
LSLSLLLFT 



STCIAGSQL? c=OGQGGYGGLGGQGAGQGGYGGLGGQGAGQGAGAAAAAAGGAGQGGYGGLG ^ 

£ GLGGYGGQGAGG AAAAAAG AGQGGRGAGCS & 
^ SQGAGRGGLGGQGAGAAAAAAGGAGOGG YGGLG 
deduziene Aminosgurcscouenz des ^ GIXKYGGQGAGGAAAAAAGAGQGGRGAGQS * 

symhetischen Faseroroteins SOI SQGAGRGGLGGQGAGAAAA.-AGGAGQGGYGGLGGQGAGQGGYGGLG ^ 

g» GLGGYGGQGAGGAAAAAAGAGQGAGQGGLGGQGAGGAAAAAAGAGQGGLGGRGAGCS 
^ SQGAGRGGQGAGAAAAAAGGAGQGGYGGLGC-QGAGQGGYGGLG ^ 

^GLGGYGGQGAGGAAAAAAGAGQGAGQGGLGGQGAGGAAAAAAGAGCGGLGGRGAGQS ^ 



"5 
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^* GLGGYGGQGAGGAAAAAAGAGQGGAGAGQS 
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A AAAQGG AGG A-AAAA.-.G AGQGG LG GRG AGQ S ^ 
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Abb. 10b 

LeB^-SignaJpeprid deduziene Aminosaureseauenz des 

MASKPF-SL svntherischen Faserproteins FA2 

LSLSL.LLFT 

STCLAG5QL GQGGYGGLGGQGAGQGGYGGLG3QGAGRGGLGGQGAGAAAAAAGGAGQGGLG ^ 

£ GLGGYGGQGAGGAAAAAAGAGQGAGQG ^ 

SQGAGRGGLGGQGAGAAAAAAGGAG ^ 

AG AG AG AG 5 AAG SG AG AG YG VG AG AG YG AG YG VG AG AG YGAG AG 3GAG AG 5G AG AG SG AGAG SGAGAG AG SG AGAG S G S 

^ GTGSSGFGPYVANGGYSGYEYAWSSKSDFETAGQAAA 

EQKLISEEDLNGS = $ KDEL. 
c-myo Immunotag ER-Reteruionssignal 
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Abb. 11 
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DNA-Sequenz von SM12-70xELP als Pflanzenexpressionskassette 

atggcttccaaaccttttctatctttgctttcactttccttgcttctctttacaagcacatg 

tttagcaggatcccagttacccgggcagggaggttatggtggtctggggggccagggtgctg 

gccaaggaggttatggtggtctggggagtcagggcgctggtcgtgggggactgggtggccaa 

ggtgcaggagctgctgctgcagctgcaggtggagccgggcagggaggtctgggagggcaggg 

agcgggccaaggtgcaggagcagctgcagcagctgcaggtggagccgggcagggaggttatg 

gtggtctggggagtcagggcgctggtcgtgggggactgggtggccaaggtgcaggagcagct 

gcagctgctgcaggtggagccgggcagggaggttatggtggtctggggagtcagggtgctgg 

tcgtggaggccaaggtgcaggagctgcagcagcagctgcaggtggagccgggcagggaggtt 

atggtggtctggggagtcagggcgctggtcgtgggggactgggtggccaaggtgcaggagca 

gctgcagctgctgcaggtggagccgggcagggaggttatggtggtctggggagtcagggtgc 

tggtcgtggaggccaaggtgcaggagctgcagcagcagctgcaggtggagccgggcagggag 

gttatggtggtctggggagtcagggtgctggtcgtggaggccaaggtgcaggagctgcagca 

gcagctgcaggtggagccgggcagggaggttatggtggtctggggggccagggtgctggcca 

aggaggttatggtggtctggggagtcagggcgctggtcgtgggggactgggtggccaaggtg 

caggagctgctgctgcagctgcaggtggagccgggcagggaggtctgggagggcagggagcg 

ggccaaggtgcaggagcagctgcagcagctgcaggtggagccgggcagggaggttatggtgg 

tctggggagtcagggtgctggtcgtggaggccaaggtgcaggagctgcagcagcagctgcag 

gtggagccgggcagggaggttatggtggtctggggagtcagggcgctggtcgtgggggactg 

ggtggccaaggtgcaggagcagctgcagctgctgcaggtggagccggcggacaagcggccgc 

agaacaaaaactcatctcagaagaggatctgaatggggccgtcgagatgggccacggcgtgg 

gtgttccgggcgtgggtgttccgggtggcggtgtgccgggcgcaggtgttcctggtgtaggt 

gtgccgggtgttggtgtgccgggtgttggtgtaccaggtggcggtgttccgggtgcaggcgt 

tccgggtggcggtgtgccgggcgtgggtgttccgggcgtgggtgttccgggtggcggtgtgc 

cgggcgcaggtgttcctggtgtaggtgtgccgggtgttggtgtgccgggtgttggtgtacca 

ggtggcggtgttccgggtgcaggcgttccgggtggcggtgtgccgggcgtgggtgttccggg 

cgtgggtgttccgggtggcggtgtgccgggcgcaggtgttcctggtgtaggtgtgccgggtg 

ttggtgtgccgggtgttggtgtaccaggtggcggtgttccgggtgcaggcgttccgggtggc 

ggtgtgccgggcgtgggtgttccgggcgtgggtgttccgggtggcggtgtgccgggcgcagg 

tgttcctggtgtaggtgtgccgggtgttggtgtgccgggtgttggtgtaccaggtggcggtg 

ttccgggtgcaggcgttccgggtggcggtgtgccgggcgtgggtgttccgggcgtgggtgtt 

ccgggtggcggtgtgccgggcgcaggtgttcctggtgtaggtgtgccgggtgttggtgtgcc 

gggtgttggtgtaccaggtggcggtgttccgggtgcaggcgttccgggtggcggtgtgccgg 

gcgtgggtgttccgggcgtgggtgttccgggtggcggtgtgccgggcgcaggtgttcctggt 

gtaggtgtgccgggtgttggtgtgccgggtgttggtgtaccaggtgg'cggtgttccgggtgc 

aggcgttccgggtggcggtgtgccgggcgtgggtgttccgggcgtgggtgttccgggtggcg 

gtgtgccgggcgcaggtgttcctggtgtaggtgtgccgggtgttggtgtgccgggtgttggt 

gtaccaggtggcggtgttccgggtgcaggcgttccgggtggcggtgtgccgggcgggctggc 

ggccgcagaacccaaagacgaactctag 
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Proteiusequenz von SM12-70xELP aus pflanzlicher Expression (SM12, c-myc-Tag, 
70xELP, KDEL - jeweils durch Absatz gekennzeichnet) 

MASKPFhSLhShShhLFTSTChAGSQLPGQGGYGGLGGQGAGQGGYGGLGSQGAGRGGLGGQ 

GAGAAAAAAGGAGQGGLGGQGAGQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGLGGQGAGAA 

AAAAGGAGQGGYGGLGSQGAGRGGQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGLGGQGAGA 

AAAAAGGAGQGGYGGLGSQGAGRGGQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGQGAGAAA 

AAAGGAGQGGYGGLGGQGAGQGGYGGLGSQGAGRGGLGGQGAGAAAAAAGGAGQGGLGGQGA 

GQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGL 
GGQGAGAAAAAAGGAGGQAAA 

EQKL I S EEDLNGAVE 

MGHGVGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVPGVGV 
PGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVPGVGVPGGGVPGAGVPG 
VGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVG 
VPGGGVPGAGVPGGGVPGVGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVP 
GGGVPGVGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVPGV 
GVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGGLAAAEP 

KDEL 
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DNA-Sequenz von SM12-70xELP als Expressionskassette fur E. coli 

atggctagcatgactggtggacagcaaatgggtcgcggatcccagttacccgggcagggagg 
ttatggtggtctggggggccagggtgctggccaaggaggttatggtggtctggggagtcagg 
gcgctggtcgtgggggactgggtggccaaggtgcaggagctgctgctgcagctgcaggtgga 
gccgggcagggaggtctgggagggcagggagcgggccaaggtgcaggagcagctgcagcagc 
tgcaggtggagccgggcagggaggttatggtggtctggggagtcagggcgctggtcgtgggg 
gactgggtggccaaggtgcaggagcagctgcagctgctgcaggtggagccgggcagggaggt 
tatggtggtctggggagtcagggtgctggtcgtggaggccaaggtgcaggagctgcagcagc 
agctgcaggtggagccgggcagggaggttatggtggtctggggagtcagggcgctggtcgtg 
ggggactgggtggccaaggtgcaggagcagctgcagctgctgcaggtggagccgggcaggga 
ggttatggtggtctggggagtcagggtgctggtcgtggaggccaaggtgcaggagctgcagc 
agcagctgcaggtggagccgggcagggaggttatggtggtctggggagtcagggtgctggtc 
gtggaggccaaggtgcaggagctgcagcagcagctgcaggtggagccgggcagggaggttat 
ggtggtctggggggccagggtgctggccaaggaggttatggtggtctggggagtcagggcgc 
tggtcgtgggggactgggtggccaaggtgcaggagctgctgctgcagctgcaggtggagccg 
ggcagggaggtctgggagggcagggagcgggccaaggtgcaggagcagctgcagcagctgca 
ggtggagccgggcagggaggttatggtggtctggggagtcagggtgctggtcgtggaggcca 
aggtgcaggagctgcagcagcagctgcaggtggagccgggcagggaggttatggtggtctgg 
ggagtcagggcgctggtcgtgggggactgggtggccaaggtgcaggagcagctgcagctgct 
gcaggtggagccggcggacaagcggccgcagaacaaaaactcatctcagaagaggatctgaa 
tggggccgtcgagatgggccacggcgtgggtgttccgggcgtgggtgttccgggtggcggtg 
tgccgggcgcaggtgttcctggtgtaggtgtgccgggtgttggtgtgccgggtgttggtgta 
ccaggtggcggtgttccgggtgcaggcgttccgggtggcggtgtgccgggcgtgggtgttcc 
gggcgtgggtgttccgggtggcggtgtgccgggcgcaggtgttcctggtgtaggtgtgccgg 
gtgttggtgtgccgggtgttggtgtaccaggtggcggtgttccgggtgcaggcgttccgggt 
ggcggtgtgccgggcgtgggtgttccgggcgtgggtgttccgggtggcggtgtgccgggcgc 
aggtgttcctggtgtaggtgtgccgggtgttggtgtgccgggtgttggtgtaccaggtggcg 
gtgttccgggtgcaggcgttccgggtggcggtgtgccgggcgtgggtgttccgggcgtgggt 
gttccgggtggcggtgtgccgggcgcaggtgttcctggtgtaggtgtgccgggtgttggtgt 
gccgggtgttggtgtaccaggtggcggtgttccgggtgcaggcgttccgggtggcggtgtgc 
cgggcgtgggtgttccgggcgtgggtgttccgggtggcggtgtgccgggcgcaggtgttcct 
ggtgtaggtgtgccgggtgttggtgtgccgggtgttggtgtaccaggtggcggtgttccggg 
tgcaggcgttccgggtggcggtgtgccgggcgtgggtgttccgggcgtgggtgttccgggtg 
gcggtgtgccgggcgcaggtgttcctggtgtaggtgtgccgggtgttggtgtgccgggtgtt 
ggtgtaccaggtggcggtgttccgggtgcaggcgttccgggtggcggtgtgccgggcgtggg 
tgttccgggcgtgggtgttccgggtggcggtgtgccgggcgcaggtgttcctggtgtaggtg 
tgccgggtgttggtgtgccgggtgttggtgtaccaggtggcggtgttccgggtgcaggcgtt 
ccgggtggcggtgtgccgggcgggctggcggccgcagaacaaaaactcatctcagaagagga 
tctgaatggggccgtcgagcaccaccaccaccaccactga 
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Proteinsequenz von SM12-70xELP aus bakterieller Expression (SM12, c-myc-Tag, 
70xELP, c-myc-Tag, HisTag - jewcils durch Absatz gekennzeicb.net) 



MASMTGGQQMGRGSQLPGQGGYGGLGGQGAGQGGYGGLGSQGAGRGGLGGQ 

GAGAAAAAAGGAGQGGLGGQGAGQGAGAAAAAAGGAGQGGYGGLGSQGAGRG 

GLGGQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGQGAGAAAAAAGGAGQGGY 

GGLGSQGAGRGGLGGQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGQGAGAAA 

AAAGGAGQGGYGGLGSQGAGRGGQGAGAAAAAAGGAGQGGYGGLGGQGAGQ 

GGYGGLGSQGAGRGGLGGQGAGAAAAAAGGAGQGGLGGQGAGQGAGAAAAAA 

GGAGQGGYGGLGSQGAGRGGQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGL 

GGQGAGAAAAAAGGAGGQAAA 

EQKLISEEDLNGAVE 

MGHGVGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGV 

PGVGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPG 

VGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVG 

VPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVP 

GVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVPGV 

GVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVPGVGV 

PGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGGLAAA 

EQKLISEEDLNGAVEHHHHHH. 
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SEQUENZPROTOKOLL 

<110> IPK - Institut fur Pf lanzengenetik und Kulturpflan 

<120> Synthetische Spinnenseidenproteine und deren Expression 
in transgenen Pflanzen 

<130> I 7222 

<140> 
<141> 

<150> DE 100 28 212.1 
<151> 2000-06-09 

<150> DE 100 53 478 . 3 
<151> 2000-10-24 

<160> 51 

<170> Patent In Ver. 2.1 

<210> 1 

<211> 22 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 1 

tatgagcgct cccgggcagg gt 22 



<210> 2 ; 
<211> 38 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 2 

agcttttagg taccaatatt aatctggccg gctccacc 3 8 



1 
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<210> 3 

<211> 12 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 3 

tatggtctgg gg 12 



<210> 4 
<211> 18 
<212> DNA 

<213> Kunstliche Sequenz 

<220> 

<223> Beschreibung der kunstlichen Sequenz ; repetitive 
Einheit aus Spidroin-Proteinen 

<400> 4 

ggccagggtg ctggccaa 18 

<210> 5 
<211> 33 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 5 

ggtgcaggag cwgcwgcwgc wgctgcaggt gga 33 



<210> 6 

<211> 28 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 



2 
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<400> 6 

gccggccaga ttaatattgg tacctaaa 

<210> 7 
<211> 17 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 7 

ctgcccggga gcgctca 



PCT/EP01/<K»5K<i 

28 



<210> 8 
<211> 15 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 8 

accaccataa cctcc 15 



<210> 9 
<211> 18 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 9 

agcaccctgg ccccccag 18 



<210> 10 
<211> 33 
<212> DNA 

<213> Kunstliche Sequenz 



3 
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<220> 



<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 



<400> 10 



tgcagcwgcw gcwgcwgctc ctgcaccttg gcc 



33 



<210> 11 

<211> 22 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 11 

tatgagatct ggccaaggag gt 22 

<210> 12 
<211> 14 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz .-repetitive 
Einheit aus Spidroin-Proteinen 

<400> 12 

ttggccagat ctca 14 

<210> 13 
<211> 27 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 



<400> 13 



agtcagggtg ctggtcgtgg aggccaa 



27 



<210> 14 



4 
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<211> 27 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 14 

tccacgacca gcaccctgac tccccag 27 



<210> 15 
<211> 36 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 15 

agtcagggcg ctggtcgtgg gggactgggt ggccaa 



<210> 16 
<211> 36 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz .-repetitive 
Einheit aus Spidroin-Proteinen 

<400> 16 

acccagtccc ccacgaccag cgccctgact ccccag 3 6 

<210> 17 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 17 

5 
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ctgggagggc agggagcggg ccaa 
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<210> 18 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 18 

cgctccctgc cctcccagac ctcc 24 



<210> 19 
<211> 327 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Konstrukt SB1 
<400> 19 

ggatcccagt tagggcaggg aggttatggt ggtctggggg gccagggtgc tggccaagga 60 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 120 
ggagctgctg ctgcagctgc aggtggagcc gggcagggag gtctgggagg gcagggagcg 180 
ggccaaggtg caggagcagc tgcagcagct gcaggtggag ccgggcaggg aggttatggt 240 
ggtctgggga gtcagggtgc tggtcgtgga ggccaaggtg caggagctgc agcagcagct 3 00 
gcaggtggag ccggacaagc ggccgca 327 

<210> 20 
<211> 705 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Konstrukt SE1 
<400> 20 

ggatcccagt tagggcaggg aggttatggt ggtctggggg gccagggtgc tggccaagga 60 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 120 
ggagctgctg ctgcagctgc aggtggagcc gggcagggag gtctgggagg gcagggagcg 18 0 
ggccaaggtg caggagcagc tgcagcagct gcaggtggag ccgggcaggg aggttatggt 240 
ggtctgggga gtcagggcgc tggtcgtggg ggactgggtg gccaaggtgc aggagcagct 3 00 
gcagctgctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 360 

6 
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ggtcgtggag gccaaggtgc aggagctgca 

ggttatggtg gtctggggag tcagggcgct 

ggagcagctg cagctgctgc aggtggagcc 

cagggtgctg gtcgtggagg ccaaggtgca 

gggcagggag gttatggtgg tctggggagt 

ggagctgcag cagcagctgc aggtggagcc 
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gcagcagctg caggtggagc cgggcaggga 42 0 
ggtcgtgggg gactgggtgg ccaaggtgca 4 80 
gggcagggag gttatggtgg tctggggagt 54 0 
ggagctgcag cagcagctgc aggtggagcc 600 
cagggtgctg gtcgtggagg ccaaggtgca 660 
ggacaagcgg ccgca 705 



<210> 21 
<211> 426 
<212> DNA 

<213> Kunstliche Sequenz 

j 

<220> 

<223> Beschreibung der kunstlichen Sequenz :Konstrukt SD1 
<400> 21 

ggatcccagt tagggcaggg aggttatggt ggtctggggg gccagggtgc tggccaagga 60 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 120 
ggagctgctg ctgcagctgc aggtggagcc gggcagggag gtctgggagg gcagggagcg 180 
ggccaaggtg caggagcagc tgcagcagct gcaggtggag ccgggcaggg aggttatggt 24 0 
ggtctgggga gtcagggtgc tggtcgtgga ggccaaggtg caggagctgc agcagcagct 300 
gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 3 60 
ggactgggtg gccaaggtgc aggagcagct gcagctgctg caggtggagc cggacaagcg 42 0 
gccgca 426 



<210> 22 
<211> 3783 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :Konstrukt 
S01S01 

■ 

<400> 22 

ggatcccagt tacccgggca gggaggttat ggtggtctgg ggggccaggg tgctggccaa 60 
ggaggttatg gtggtctggg gggccagggt gctggccaag gtgcaggagc tgctgctgca 120 
gctgcaggtg gagccgggca gggaggttat ggtggtctgg ggagtcaggg tgctggtcgt 180 
ggaggccaag gtgcaggagc tgcagcagca gctgcaggtg gagccgggca gggaggttat 240 
ggtggtctgg ggagtcaggg cgctggtcgt gggggactgg gtggccaagg tgcaggagca 3 00 
gctgcagctg ctgcaggtgg agccgggcag ggaggttatg gtggtctggg gagtcagggt 3 60 
gctggtcgtg gaggccaagg tgcaggagct gcagcagcag ctgcaggtgg agccgggcag 420 
ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 4 80 
gcaggagcag ctgcagctgc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 54 0 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 600 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 660 
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ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 720 
gccgggcagg gaggttatgg tggtctgggg agtcagggcg ctggtcgtgg aggccaaggt 780 
gcaggagctg cagcagcagc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 840 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 900 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 960 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 1020 
gccgggcagg gaggttatgg tggtctgggg agtcagggcg ctggtcgtgg gggactgggt 1080 
ggccaaggtg caggagcagc tgcagctgct gcaggtggag ccgggcaggg aggttatggt 1140 
ggtctgggga gtcagggtgc tggtcgtgga ggccaaggtg caggagctgc agcagcagct 1200 
gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 12 60 
ggactgggtg gccaaggtgc aggagcagct gcagctgctg caggtggagc cgggcaggga 1320 
ggttatggtg gtctggggag tcagggtgct ggtcgtggag gccaaggtgc aggagctgca 13 8 0 
gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 144 0 
ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 1500 
ggttatggtg gtctgggggg ccagggtgct ggccaaggag gttatggtgg tctggggagt 1560 
cagggcgctg gtcgtggggg actgggtggc caaggtgcag gagctgctgc tgcagctgca 1620 
ggtggagccg ggcagggagg tctgggaggg cagggagcgg gccaaggtgc aggagcagct 1680 
gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 1740 
ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 1800 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 1860 
ggagcagctg cagctgctgc aggtggagcc gggcagggag gttatggtgg tctggggggc 1920 
cagggtgctg gccaaggagg ttatggtggt ctggggggcc agggtgctgg ccaaggtgca 1980 
ggagctgctg ctgcagctgc aggtggagcc gggcagggag gttatggtgg tctggggagt 2040 
cagggtgctg gtcgtggagg ccaaggtgca ggagctgcag cagcagctgc aggtggagcc 2100 
gggcagggag gttatggtgg tctggggagt cagggcgctg gtcgtggggg actgggtggc 2160 
caaggtgcag gagcagctgc agctgctgca ggtggagccg ggcagggagg ttatggtggt 2220 
ctggggagtc agggtgctgg tcgtggaggc caaggtgcag gagctgcagc agcagctgca 2280 
ggtggagccg ggcagggagg ttatggtggt ctggggagtc agggcgctgg tcgtggggga 2340 
ctgggtggcc aaggtgcagg agcagctgca gctgctgcag gtggagccgg gcagggaggt 2400 
tatggtggtc tggggggcca gggtgctggc caaggaggtt atggtggtct ggggagtcag 24 60 
ggcgctggtc gtgggggact gggtggccaa ggtgcaggag ctgctgctgc agctgcaggt 2520 
ggagccgggc agggaggtct gggagggcag ggagcgggcc aaggtgcagg agcagctgca 2580 
gcagctgcag gtggagccgg gcagggaggt tatggtggtc tggggagtca gggtgctggt 2640 
cgtggaggcc aaggtgcagg agctgcagca gcagctgcag gtggagccgg gcagggaggt 2700 
tatggtggtc tggggggcca gggtgctggc caaggaggtt atggtggtct ggggagtcag 2760 
ggcgctggtc gtgggggact gggtggccaa ggtgcaggag ctgctgctgc agctgcaggt 2 820 
ggagccgggc agggaggtct gggagggcag ggagcgggcc aaggtgcagg agcagctgca 2880 
gcagctgcag gtggagccgg gcagggaggt tatggtggtc tggggagtca gggcgctggt 2 940 
cgtgggggac tgggtggcca aggtgcagga gcagctgcag ctgctgcagg tggagccggg 3 000 
cagggaggtt atggtggtct ggggagtcag ggtgctggtc gtggaggcca aggtgcagga 3 060 
gctgcagcag cagctgcagg tggagccggg cagggaggtt atggtggtct ggggagtcag 312 0 
ggcgctggtc gtgggggact gggtggccaa ggtgcaggag cagctgcagc tgctgcaggt 3180 
ggagccgggc agggaggtta tggtggtctg gggagtcagg gtgctggtcg tggaggccaa 3240 
ggtgcaggag ctgcagcagc agctgcaggt ggagccgggc agggaggtta tggtggtctg 3300 
gggagtcagg gtgctggtcg tggaggccaa ggtgcaggag ctgcagcagc agctgcaggt 33 60 
ggagccgggc agggaggtta tggtggtctg gggggccagg gtgctggcca aggaggttat 342 0 
ggtggtctgg ggagtcaggg cgctggtcgt gggggactgg gtggccaagg tgcaggagct 3480 
gctgctgcag ctgcaggtgg agccgggcag ggaggtctgg gagggcaggg agcgggccaa 354 0 
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ggtgcaggag cagctgcagc agctgcaggt ggagccgggc agggaggtta tggtggtctg 3600 

gggagtcagg gtgctggtcg tggaggccaa ggtgcaggag ctgcagcagc agctgcaggt 3660 

ggagccgggc agggaggtta tggtggtctg gggagtcagg gcgctggtcg tgggggactg 3720 

ggtggccaag gtgcaggagc agctgcagct gctgcaggtg gagccggcgg acaagcggcc 3780 
gca 3783 



<210> 23 

<211> 2985 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :Konstrukt 
S01SM12 

<400> 23 

ggatcccagt tacccgggca gggaggttat ggtggtctgg ggggccaggg tgctggccaa 60 
ggaggttatg gtggtctggg gggccagggt gctggccaag gtgcaggagc tgctgctgca 12 0 
gctgcaggtg gagccgggca gggaggttat ggtggtctgg ggagtcaggg tgctggtcgt 180 
ggaggccaag gtgcaggagc tgcagcagca gctgcaggtg gagccgggca gggaggttat 240 
ggtggtctgg ggagtcaggg cgctggtcgt gggggactgg gtggccaagg tgcaggagca 300 
gctgcagctg ctgcaggtgg agccgggcag ggaggttatg gtggtctggg gagtcagggt 360 
gctggtcgtg gaggccaagg tgcaggagct gcagcagcag ctgcaggtgg agccgggcag 420 
ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 480 
gcaggagcag ctgcagctgc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 54 0 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 600 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 660 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 72 0 
gccgggcagg gaggttatgg tggtctgggg agtcagggtg ctggtcgtgg aggccaaggt 780 
gcaggagctg cagcagcagc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 840 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 900 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 960 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 102 0 
gccgggcagg gaggttatgg tggtctgggg agtcagggcg ctggtcgtgg gggactgggt 1080 
ggccaaggtg -caggagcagc tgcagctgct gcaggtggag ccgggcaggg aggttatggt 1140 
ggtctgggga gtcagggtgc tggtcgtgga ggccaaggtg caggagctgc agcagcagct 1200 
gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 12 60 
ggactgggtg gccaaggtgc aggagcagct gcagctgctg caggtggagc cgggcaggga 132 0 
ggttatggtg gtctggggag tcagggtgct ggtcgtggag gccaaggtgc aggagctgca 1380 
gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 1440 
ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 15 00 
ggttatggtg gtctgggggg ccagggtgct ggccaaggag gttatggtgg tctggggagt 1560 
cagggcgctg gtcgtggggg actgggtggc caaggtgcag gagctgctgc tgcagctgca 1620 
ggtggagccg ggcagggagg tctgggaggg cagggagcgg gccaaggtgc aggagcagct 1680 
gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 174 0 
ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 1800 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 1860 
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ggagcagctg cagctgctgc aggtggagcc gggcagggag gttatggtgg tctggggggc 192 0 

cagggtgctg gccaaggagg ttatggtggt ctggggagtc agggcgctgg tcgtggggga 1980 

ctgggtggcc aaggtgcagg agctgctgct gcagctgcag gtggagccgg gcagggaggt 2 04 0 

ctgggagggc agggagcggg ccaaggtgca ggagcagctg cagcagctgc aggtggagcc 2100 

gggcagggag gttatggtgg tctggggagt cagggcgctg gtcgtggggg actgggtggc 2160 

caaggtgcag gagcagctgc agctgctgca ggtggagccg ggcagggagg ttatggtggt 2220 

ctggggagtc agggtgctgg tcgtggaggc caaggtgcag gagctgcagc agcagctgca 2280 

ggtggagccg ggcagggagg ttatggtggt ctggggagtc agggcgctgg tcgtggggga 2340 

ctgggtggcc aaggtgcagg agcagctgca gctgctgcag gtggagccgg gcagggaggt 24 00 

tatggtggtc tggggagtca gggtgctggt cgtggaggcc aaggtgcagg agctgcagca 2460 

gcagctgcag gtggagccgg gcagggaggt tatggtggtc tggggagtca gggtgctggt 252 0 

cgtggaggcc aaggtgcagg agctgcagca gcagctgcag gtggagccgg gcagggaggt 2580 

tatggtggtc tggggggcca gggtgctggc caaggaggtt atggtggtct ggggagtcag 264 0 

ggcgctggtc gtgggggact gggtggccaa ggtgcaggag ctgctgctgc agctgcaggt 2700 

ggagccgggc agggaggtct gggagggcag ggagcgggcc aaggtgcagg agcagctgca 2760 

gcagctgcag gtggagccgg gcagggaggt tatggtggtc tggggagtca gggtgctggt 282 0 

cgtggaggcc aaggtgcagg agctgcagca gcagctgcag gtggagccgg gcagggaggt 2880 

tatggtggtc tggggagtca gggcgctggt cgtgggggac tgggtggcca aggtgcagga 2940 

gcagctgcag ctgctgcagg tggagccggc ggacaagcgg ccgca 2985 



<210> 24 

<211> 5658 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Konstrukt 
S01SO1S01 

<400> 24 

ggatcccagt tacccgggca gggaggttat ggtggtctgg ggggccaggg tgctggccaa 60 
ggaggttatg gtggtctggg gggccagggt gctggccaag gtgcaggagc tgctgctgca 120 
gctgcaggtg gagccgggca gggaggttat ggtggtctgg ggagtcaggg tgctggtcgt 180 
ggaggccaag gtgcaggagc tgcagcagca gctgcaggtg gagccgggca gggaggttat 240 
99tggtctgg ggagtcaggg cgctggtcgt gggggactgg gtggccaagg. tgcaggagca 300 
gctgcagctg ctgcaggtgg agccgggcag ggaggttatg gtggtctggg gagtcagggt 360 
gctggtcgtg gaggccaagg tgcaggagct gcagcagcag ctgcaggtgg agccgggcag 420 
ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 480 
gcaggagcag ctgcagctgc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 54 0 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 60 0 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 660 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 720 
gccgggcagg gaggttatgg tggtctgggg agtcagggtg ctggtcgtgg aggccaaggt 780 
gcaggagctg cagcagcagc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 840 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 90 0 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 960 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 102 0 
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gccgggcagg gaggttatgg tggtctgggg agtcagggcg ctggtcgtgg gggactgggt 1080 
ggccaaggtg caggagcagc tgcagctgct gcaggtggag ccgggcaggg aggttatggt 114 0 
ggtctgggga gtcagggtgc tggtcgtgga ggccaaggtg caggagctgc agcagcagct 1200 
gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 1260 
ggactgggtg gccaaggtgc aggagcagct gcagctgctg caggtggagc cgggcaggga 1320 
ggttatggtg gtctggggag tcagggtgct ggtcgtggag gccaaggtgc aggagctgca 13 80 
gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 144 0 
ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 1500 
ggttatggtg gtctgggggg ccagggtgct ggccaaggag gttatggtgg tctggggagt 1560 
cagggcgctg gtcgtggggg actgggtggc caaggtgcag gagctgctgc tgcagctgca 162 0 
ggtggagccg ggcagggagg tctgggaggg cagggagcgg gccaaggtgc aggagcagct 1680 
gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 174 0 
ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 1800 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 1860 
ggagcagctg cagctgctgc aggtggagcc gggcagggag gttatggtgg tctggggggc 1920 
cagggtgctg gccaaggagg ttatggtggt ctggggggcc agggtgctgg ccaaggtgca 1980 
ggagctgctg ctgcagctgc aggtggagcc gggcagggag gttatggtgg tctggggagt 2040 
cagggtgctg gtcgtggagg ccaaggtgca ggagctgcag cagcagctgc aggtggagcc 2100 
gggcagggag gttatggtgg tctggggagt cagggcgctg gtcgtggggg actgggtggc 2160 
caaggtgcag gagcagctgc agctgctgca ggtggagccg ggcagggagg ttatggtggt 2220 
ctggggagtc agggtgctgg tcgtggaggc caaggtgcag gagctgcagc agcagctgca 22 8 0 
ggtggagccg ggcagggagg ttatggtggt ctggggagtc agggcgctgg tcgtggggga 2340 
ctgggtggcc aaggtgcagg agcagctgca gctgctgcag gtggagccgg gcagggaggt 24 00 
tatggtggtc tggggggcca gggtgctggc caaggaggtt atggtggtct ggggagtcag 2460 
ggcgctggtc gtgggggact gggtggccaa ggtgcaggag ctgctgctgc agctgcaggt 2520 
ggagccgggc agggaggtct gggagggcag ggagcgggcc aaggtgcagg agcagctgca 25 80 
gcagctgcag gtggagccgg gcagggaggt tatggtggtc tggggagtca gggtgctggt 2640 
cgtggaggcc aaggtgcagg agctgcagca gcagctgcag gtggagccgg gcagggaggt 2700 
tatggtggtc tggggggcca gggtgctggc caaggaggtt atggtggtct ggggagtcag 2 760 
ggcgctggtc gtgggggact gggtggccaa ggtgcaggag ctgctgctgc agctgcaggt 2820 
ggagccgggc agggaggtct gggagggcag ggagcgggcc aaggtgcagg agcagctgca 2880 
gcagctgcag gtggagccgg gcagggaggt tatggtggtc tggggagtca gggcgctggt 2940 
cgtgggggac tgggtggcca aggtgcagga gcagctgcag ctgctgcagg tggagccggg 3000 
cagggaggtt atggtggtct ggggagtcag ggtgctggtc gtggaggcca aggtgcagga 3060 
gctgcagcag cagctgcagg tggagccggg cagggaggtt atggtggtct ggggagtcag 3120 
ggcgctggtc gtgggggact gggtggccaa ggtgcaggag cagctgcagc tgctgcaggt 318 0 
ggagccgggc agggaggtta tggtggtctg gggagtcagg gtgctggtcg tggaggccaa 3240 
ggtgcaggag ctgcagcagc agctgcaggt ggagccgggc , agggaggtta tggtggtctg 3300 
gggagtcagg gtgctggtcg tggaggccaa ggtgcaggag /ctgcagcagc agctgcaggt 3360 
ggagccgggc agggaggtta tggtggtctg gggggccagg gtgctggcca aggaggttat 342 0 
ggtggtctgg ggagtcaggg cgctggtcgt gggggactgg gtggccaagg tgcaggagct 3480 
gctgctgcag ctgcaggtgg agccgggcag ggaggtctgg gagggcaggg agcgggccaa 3540 
ggtgcaggag cagctgcagc agctgcaggt ggagccgggc agggaggtta tggtggtctg 3600 
gggagtcagg gtgctggtcg tggaggccaa ggtgcaggag ctgcagcagc agctgcaggt 3660 
ggagccgggc agggaggtta tggtggtctg gggagtcagg gcgctggtcg tgggggactg 3720 
ggtggccaag gtgcaggagc agctgcagct gctgcaggtg gagccgggca gggaggttat 3780 
ggtggtctgg ggggccaggg tgctggccaa ggaggttatg. gtggtctggg gggccagggt 3 840 
gctggccaag gtgcaggagc tgctgctgca gctgcaggtg gagccgggca gggaggttat 3900 
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ggtggtctgg ggagtcaggg tgctggtcgt ggaggccaag gtgcaggagc tgcagcagca 3 960 
gctgcaggtg gagccgggca gggaggttat ggtggtctgg ggagtcaggg cgctggtcgt 4 020 
gggggactgg gtggccaagg tgcaggagca gctgcagctg ctgcaggtgg agccgggcag 4080 
ggaggttatg gtggtctggg gagtcagggt gctggtcgtg gaggccaagg tgcaggagct 4140 
gcagcagcag ctgcaggtgg agccgggcag ggaggttatg gtggtctggg gagtcagggc 4200 
gctggtcgtg ggggactggg tggccaaggt gcaggagcag ctgcagctgc tgcaggtgga 4260 
gccgggcagg gaggttatgg tggtctgggg ggccagggtg ctggccaagg aggttatggt 4320 
ggtctgggga gtcagggcgc tggtcgtggg ggactgggtg gccaaggtgc aggagctgct 4380 
gctgcagctg caggtggagc cgggcaggga ggtctgggag ggcagggagc gggccaaggt 4440 
gcaggagcag ctgcagcagc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 4500 
agtcagggtg ctggtcgtgg aggccaaggt gcaggagctg cagcagcagc tgcaggtgga 4560 
gccgggcagg gaggttatgg tggtctgggg ggccagggtg ctggccaagg aggttatggt 4620 
ggtctgggga gtcagggcgc tggtcgtggg ggactgggtg gccaaggtgc aggagctgct 4680 
gctgcagctg caggtggagc cgggcaggga ggtctgggag ggcagggagc gggccaaggt 4740 
gcaggagcag ctgcagcagc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 4800 
agtcagggcg ctggtcgtgg gggactgggt ggccaaggtg caggagcagc tgcagctgct 4860 
gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggtgc tggtcgtgga 4920 
ggccaaggtg caggagctgc agcagcagct gcaggtggag ccgggcaggg aggttatggt 4980 
ggtctgggga gtcagggcgc tggtcgtggg ggactgggtg gccaaggtgc aggagcagct 5040 
gcagctgctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 5100 
ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 5160 
ggttatggtg gtctggggag tcagggtgct ggtcgtggag gccaaggtgc aggagctgca 5220 
gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctgggggg ccagggtgct 5280 
ggccaaggag gttatggtgg tctggggagt cagggcgctg gtcgtggggg actgggtggc 5340 
caaggtgcag gagctgctgc tgcagctgca ggtggagccg ggcagggagg tctgggaggg 5400 
cagggagcgg gccaaggtgc aggagcagct gcagcagctg caggtggagc cgggcaggga 5460 
ggttatggtg gtctggggag tcagggtgct ggtcgtggag gccaaggtgc aggagctgca 5520 
gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggcgct 5580 
ggtcgtgggg gactgggtgg ccaaggtgca ggagcagctg cagctgctgc aggtggagcc 564 0 
ggcggacaag cggccgca 5658 

<210> 25 
<211> 672 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunst lichen Sequenz : Konstrukt FA2 
<400> 25 

ggatcccagt tagggcaggg aggttatggt ggtctggggg gccagggtgc tggccaagga 60 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 120 
ggagctgctg ctgcagctgc aggtggagcc gggcagggag gtctgggagg gcagggagcg 180 
ggccaaggtg caggagcagc tgcagcagct gcaggtggag ccgggcaggg aggttatggt 240 
ggtctgggga gtcagggcgc tggtcgtggg ggactgggtg gccaaggtgc aggagcagct 300 
gcagctgctg caggtggagc cgggtccgga agtggtgcag gtgccggaag cggagcagga 3 60 
gccggtgccg gatctggtgc cggtgccgga agcggtgctg gtgccggaag cggtgctggt 42 0 
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gccggatcag gagcgggtgc cggttatggt gcgggagccg gtgttgggta cggagccggt 4 80 

tatggagcgg gagccggtgt tgggtacgga gccggtgcag gttccggggc cgcaagcggc 540 

gcaggagccg gtgccggagc tgggacaggg agttcaggat ttgggcccta cgttgcaaat 600 

ggtggttatt caggctatga atacgcgtgg agtagtaagt ctgattttga gactgccgga 660 
caagcggccg ca 672 



<210> 26 
<211> 525 
<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz : Konstrukt SA1 



<400> 26 

ggatcccagt tagggcaggg aggttatggt 
ggttatggtg gtctgggggg ccagggtgct 
gcaggtggag ccgggcaggg aggttatggt 
ggccaaggtg caggagctgc agcagcagct 
ggtctgggga gtcagggcgc tggtcgtggg 
gcagctgctg caggtggagc cgggcaggga 
ggtcgtggag gccaaggtgc aggagctgca 
ggttatggtg gtctggggag tcagggcgct 
ggagcagctg cagctgctgc aggtggagcc 



ggtctggggg gccagggtgc tggccaagga 60 
ggccaaggtg caggagctgc tgctgcagct 120 
ggtctgggga gtcagggtgc tggtcgtgga 180 
gcaggtggag ccgggcaggg aggttatggt 240 
ggactgggtg gccaaggtgc aggagcagct 300 
ggttatggtg gtctggggag tcagggtgct 360 
gcagcagctg caggtggagc cgggcaggga 42 0 
ggtcgtgggg gactgggtgg ccaaggtgca 4 80 
ggacaagcgg ccgca 525 



<210> 27 
<211> 1908 
<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz : Konstrukt SOI 



<400-> 27 

ggatcccagt tacccgggca 
ggaggttatg gtggtctggg 
gctgcaggtg gagccgggca 
ggaggccaag gtgcaggagc 
ggtggtctgg ggagtcaggg 
gctgcagctg ctgcaggtgg 
gctggtcgtg gaggccaagg 
ggaggttatg gtggtctggg 
gcaggagcag ctgcagctgc 
ggccagggtg ctggccaagg 
ggactgggtg gccaaggtgc 
ggtctgggag ggcagggagc 



gggaggttat ggtggtctgg 
gggccagggt gctggccaag 
gggaggttat ggtggtctgg 
tgcagcagca gctgcaggtg 
cgctggtcgt gggggactgg 
agccgggcag ggaggttatg 
tgcaggagct gcagcagcag 
gagtcagggc gctggtcgtg 
tgcaggtgga gccgggcagg 
aggttatggt ggtctgggga 
aggagctgct gctgcagctg 
gggccaaggt gcaggagcag 

13 



ggggccaggg 


tgctggccaa 


60 


gtgcaggagc 


tgctgctgca 


120 


ggagtcaggg 


tgctggtcgt 


180 


gagccgggca 


gggaggttat 


240 


gtggccaagg 


tgcaggagca 


300 


gtggtctggg 


gagtcagggt 


360 


ctgcaggtgg 


agccgggcag 


420 


ggggactggg 


tggccaaggt 


480 


gaggttatgg 


tggtctgggg 


540 


gtcagggcgc 


tggtcgtggg 


600 


caggtggagc 


cgggcaggga 


660 


ctgcagcagc 


tgcaggtgga 


720 
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gccgggcagg gaggttatgg tggtctgggg agtcagggtg ctggtcgtgg aggccaaggt 780 

gcaggagctg cagcagcagc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 840 

ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 900 

ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 960 

ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 1020 

gccgggcagg gaggttatgg tggtctgggg agtcagggcg ctggtcgtgg gggactgggt 1080 

ggccaaggtg caggagcagc tgcagctgct gcaggtggag ccgggcaggg aggttatggt 1140 

ggtctgggga gtcagggtgc tggtcgtgga ggccaaggtg caggagctgc agcagcagct 1200 

gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 1260 

ggactgggtg gccaaggtgc aggagcagct gcagctgctg caggtggagc cgggcaggga 1320 

ggttatggtg gtctggggag tcagggtgct ggtcgtggag gccaaggtgc aggagctgca 1380 

gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 144 0 

ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 1500 

ggttatggtg gtctgggggg ccagggtgct ggccaaggag gttatggtgg tctggggagt 1560 

cagggcgctg gtcgtggggg actgggtggc caaggtgcag gagctgctgc tgcagctgca 1620 

ggtggagccg ggcagggagg tctgggaggg cagggagcgg gccaaggtgc aggagcagct 1680 

gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 1740 

ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 1800 

ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 1860 

ggagcagctg cagctgctgc aggtggagcc ggcggacaag cggccgca 1908 



<210> 28 
<211> 1110 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Konstrukt 
SM12 

<400> 28 

ggatcccagt tacccgggca gggaggttat ggtggtctgg ggggccaggg tgctggccaa 60 
ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 12 0 
gcaggagctg ctgctgcagc tgcaggtgga gccgggcagg gaggtctggg agggcaggga 18 0 
gcgggccaag gtgcaggagc agctgcagca gctgcaggtg gagccgggca gggaggttat 240 
ggtggtctgg ggagtcaggg cgctggtcgt gggggactgg gtggccaagg tgcaggagca 300 
gctgcagctg ctgcaggtgg agccgggcag ggaggttatg gtggtctggg gagtcagggt 360 
gctggtcgtg gaggccaagg tgcaggagct gcagcagcag ctgcaggtgg agccgggcag 420 
ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 4 80 
gcaggagcag ctgcagctgc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 540 
agtcagggtg ctggtcgtgg aggccaaggt gcaggagctg cagcagcagc tgcaggtgga 600 
gccgggcagg gaggttatgg tggtctgggg agtcagggtg ctggtcgtgg aggccaaggt 660 
gcaggagctg cagcagcagc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 720 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 780 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 84 0 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 900 
gccgggcagg gaggttatgg tggtctgggg agtcagggtg ctggtcgtgg aggccaaggt 960 
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gcaggagctg cagcagcagc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 1020 

agtcagggcg ctggtcgtgg gggactgggt ggccaaggtg caggagcagc tgcagctgct 1080 

gcaggtggag ccggcggaca agcggccgca 1110 

<210> 29 
<211> 831 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunst lichen Sequenz : Konstrukt SF1 
<400> 29 

ggatcccagt tacccgggca gggaggttat ggtggtctgg ggggccaggg tgctggccaa 60 
ggaggttatg gtggtctggg gggccagggt gctggccaag gtgcaggagc tgctgctgca 120 
gctgcaggtg gagccgggca gggaggttat ggtggtctgg ggagtcaggg tgctggtcgt 180 
ggaggccaag gtgcaggagc tgcagcagca gctgcaggtg gagccgggca gggaggttat 240 
ggtggtctgg ggagtcaggg cgctggtcgt gggggactgg gtggccaagg tgcaggagca 3 00 
gctgcagctg ctgcaggtgg agccgggcag ggaggttatg gtggtctggg gagtcagggt 360 
gctggtcgtg gaggccaagg tgcaggagct gcagcagcag ctgcaggtgg agccgggcag 42 0 
ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 480 
gcaggagcag ctgcagctgc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 54 0 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 600 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 660 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 720 
gccgggcagg gaggttatgg tggtctgggg agtcagggtg ctggtcgtgg aggccaaggt 7 80 
gcaggagctg cagcagcagc tgcaggtgga gccggcggac aagcggccgc a 831 



<210> 30 
<211> 104 
<212> PRT 

<213> Kunstliche Sequenz 
! <220> 

4 

<223> Beschreibung der kunstlichen Sequenz :SBl-Protein 
<400> 30 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly 

20 25 30 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
35 40 45 
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Gly Gly Leu Gly Gly Gin Gly Ala Gly 
50 55 

Ala Ala Ala Gly Gly Ala Gly Gin Gly 
65 70 

Gin Gly Ala Gly Arg Gly Gly Gin Gly 

85 

Ala Gly Gly Ala Gly Gin Ala Ala 

100 



PCT/EPO 1/06586 

Gin Gly Ala Gly Ala Ala Ala 
60 

Gly Tyr Gly Gly Leu Gly Ser 
75 80 

Ala Gly Ala Ala Ala Ala Ala 
90 95 



<210> 31 
<211> 230 
<212> PRT 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : SE1- Protein 
<400> 31 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly 

20 25 30 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
35 40 45 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser, 
65 70 75 80; \ 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 

85 90 95 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 

100 105 110 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 

16 



-DOCID <WO. 0194393A2 I. > 



WO 01/94393 



PCT/EPiM/or.586 



Gly Ala Gly Arg 
145 

Ala Ala Ala Gly 



Gin Gly Ala Gly 

180 

Ala Gly Gly Ala 
195 

Ala Gly Arg Gly 
210 

Gly Ala Gly Gin 
225 



Gly Gly Leu Gly 
150 

Gly Ala Gly Gin 
165 

Arg Gly Gly Gin 



Gly Gin Gly Gly 

200 



Ala Ala 
230 



Gly Gin Gly Ala 
155 

Gly Gly Tyr Gly 
170 

Gly Ala Gly Ala 
185 

Tyr Gly Gly Leu 



Gly Ala Ala Ala 

160 

Gly Leu Gly Ser 
175 

Ala Ala Ala Ala 
190 

Gly Ser Gin Gly 
205 



Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
215 220 



<210> 32 
<211> 137 
<212> PRT 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : SD1 -Protein 
<400> 32 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
1 5 10 15 

* 

Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly 

20 25 30 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
35 40 45 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 

85 90 95 

Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly 
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100 105 110 

Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

Ala Ala Gly Gly Ala Gly Gin Ala Ala 
130 135 



<210> 33 
<211> 1255 
<212> PRT 

<213> Kunstliche Sequenz 
<220> 

i 

<223> Beschreibung der kunstlichen 
Sequenz : SOlSOl-Protein 

<400> 33 : 
Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 

20 25 30 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
35 40 45 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 

85 90 95 

♦ 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly : 

100 105 110 

i 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala- Ala 
115 120 125 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala : 
145 150 155 160 
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Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly 

165 170 175 

Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 

180 185 190 

Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
195 200 205 

Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 
210 215 220 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
225 230 235 240 

Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala 

245 250 255 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly 

260 265 270 

Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
275 280 285 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
290 295 300 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin 
305 310 , 315 320 

■ 
■ 

i 

Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 

325 330 335 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 

340 345 350 

Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
355 360 365 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 
370 375 380 

Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 
385 39a 395 400 

Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly 

405 410 415 
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Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 

420 425 430 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
435 440 445 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
450 455 460 

Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin 
465 470 475 480 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 

485 490 495 

Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly 

500 505 510 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala 
515 520 525 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly 
530 535 540 

Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
545 550 555 560 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 

565 570 575 

Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 

580 585 590 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
595 600 605 \ 

Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
610 615 620 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 
625 630 635 640 

Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly 

645 650 655 

Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly 

660 665 670 
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Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala 
675 680 685 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
690 695 700 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
705 710 715 720 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 

725 730 735 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 

740 745 750 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
755 760 765 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
770 775 780 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
785 790 795 800 

Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly 

805 810 815 

Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 

820 825 830 

> 

■ ■ 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly 
835 840 845 

Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly 
850 855 860 

Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly 
865 870 875 880 

Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr 

885 890 895 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 

900 905 910 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly 

915 920 925 
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Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly 

930 935 940 

Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
945 950 955 960 

i 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 

965 970 975 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 

980 985 990 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
995 1000 1005 

■ 

Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
1010 1015 1020 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
1025 1030 1035 1040 

Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 

1045 1050 1055 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 

1060 * 1065 1070 

Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 
1075 1080 1085 

Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly 
1090 1095 1100 

Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly 
1105 1110 1115 1120 

i 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly 

1125 1130 1135 

Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly 

1140 1145 1150 i 

Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu 
1155 1160 1165 i 

Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 
1170 1175 1180 
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Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 
1185 1190 1195 1200 

Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 

1205 1210 1215 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 

1220 1225 1230 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 

1235 1240 1245 

Gly Ala Gly Gly Gin Ala Ala 
1250 1255 



<210> 34 
<211> 989 
<212> PRT 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen 
Sequenz : S01SM12 -Protein 

<400> 34 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
1 5 10 15 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 

20 25 30 

■ 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
35 40 45 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 

85 90 95 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 

100 105 110 
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Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala 
145 150 155 160 

* 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly 

165 170 175 

Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 

180 185 190 

Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
195 200 205 

Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 
210 215 220 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
225 230 235 240 

Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala 

245 250 255 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly 

260 265 270 

Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
275 280 285 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
290 295 300 



Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin 
305 310 315 320 

Gly Ala Gly Gin Gly Ala Gly Ala- Ala Ala Ala Ala Ala Gly Gly Ala 



325 



330 



335 



i i 



Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 

340 345 350 



Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
355 360 365 
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Ala Gly Gin Gly Gly Tyr 
370 

Gly Gly Gin Gly Ala Gly 
385 390 

Gin Gly Gly Tyr Gly Gly 

405 

Leu Gly Gly Gin Gly Ala 

420 

Gly Gin Gly Gly Tyr Gly 
435 

Gly Gin Gly Ala Gly Ala 
450 

Gly Gly Tyr Gly Gly Leu 
465 470 

Gly Ala Gly Ala Ala Ala 

485 

Tyr Gly Gly Leu Gly Gly 

500 

Leu Gly Ser Gin Gly Ala 
515 

Gly Ala Ala Ala Ala Ala 
530 

Gly Gin Gly Ala Gly Gin 
545 550 

Gly Ala Gly Gin Gly Gly 

565 

Arg Gly Gly Gin Gly Ala 

580 

Gly Gin Gly Gly Tyr Gly 
595 

Gly Leu Gly Gly Gin Gly 
610 



Gly Gly Leu Gly Ser Gin 
375 380 

Ala Ala Ala Ala Ala Ala 

395 

Leu Gly Ser Gin Gly Ala 

410 

Gly Ala Ala Ala Ala Ala 
425 

Gly Leu Gly Ser Gin Gly 
440 

Ala Ala Ala Ala Ala Gly 
455 460 

Gly Ser Gin Gly Ala Gly 

475 

Ala Ala Ala Gly Gly Ala 

490 

Gin Gly Ala Gly Gin Gly 
505 

Gly Arg Gly Gly Leu Gly 
520 

Ala Gly Gly Ala Gly Gin 
535 540 

Gly Ala Gly Ala Ala Ala 

555 

Tyr Gly Gly Leu Gly Ser 

570 

Gly Ala Ala Ala Ala Ala 
585 

Gly Leu Gly Ser Gin Gly 
600 

Ala Gly Ala Ala Ala Ala 
615 620 



PCT/EPO 1/06586 
Gly Ala Gly Arg 



Gly Gly Ala Gly 

400 

Gly Arg Gly Gly 
415 

Ala Gly Gly Ala 
430 

Ala Gly Arg Gly 
445 

Gly Ala Gly Gin 



Arg Gly Gly Gin 

480 

Gly Gin Gly Gly 
495 

Gly Tyr Gly Gly 
510 

Gly Gin Gly Ala 
525 

Gly Gly Leu Gly 



Ala Ala Ala Gly 

560 

Gin Gly Ala Gly 
575 

Ala Gly Gly Ala 
590 

Ala Gly Arg Gly 
605 

Ala Ala Gly Gly 
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Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 

625 630 635 640 

Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu 

645 650 655 

Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 

660 665 670 

* 

Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala 
675 680 685 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
690 695 700 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
705 710 715 720 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 

725 730 735 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 

740 745 750 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
755 760 765 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
770 775 780 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
785 790 795 800 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 

805 810 815 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 

820 825 830 

Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 
835 840 845 

i 

Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala 
850 855 860 

Gly Gin Gly Gly Tyr Gly Gly Leu Giy Ser Gin Gly Ala Gly Arg Gly 
865 870 875 880 
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Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 

885 890 895 

Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly 

900 905 910 

Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
915 920 925 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala 
930 935 940 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
945 950 955 960 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 

965 970 975 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gly Gin Ala Ala 

980 985 



<210> 35 
<211> 1880 
<212> PRT 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen 
Sequenz : SOlSOlSOl-Protein 

<400> 35 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 

20 25 30 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
35 40 45 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 8 0 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
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85 90 95 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 

100 105 110 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

* 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala 
145 150 155 160 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly 

165 170 175 

Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 

180 185 190 

Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
195 200 205 

Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 
210 215 220 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
225 230 235 240 

Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala 

245 250 255 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly 

260 265 270 

Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
275 280 285 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
290 295 : ' 300 

■ 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin 
305 310 315 320 

Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 

325 330 335 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
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340 



345 



350 



Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
355 360 365 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 
370 375 380 

Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 
385 390 395 400 

Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly 

405 410 415 

Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 

420 425 430 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
435 440 445 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
450 455 460 

Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin 
465 470 475 480 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 

485 490 495 

Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly 

500: / 505 510 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala 
515 520 525 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly 
530 535 540 

Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
545 550 555 560 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 

565 570 575 

Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 

580 585 590 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
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595 

Gly Leu Gly Gly Gin Gly 
610 

Ala Gly Gin Gly Gly Tyr 
625 630 

Gly Gly Tyr Gly Gly Leu 

645 

Ala Ala Ala Ala Ala Ala 

660 

Leu Gly Ser Gin Gly Ala 
675 

Ala Ala Ala Ala Gly Gly 
690 

Ser Gin Gly Ala Gly Arg 
705 710 

Ala Ala Ala Ala Ala Gly 

725 

Gly Ser Gin Gly Ala Gly 

740 

Ala Ala Ala Gly Gly Ala 

755 

Gin Gly Ala Gly Arg Gly 
770 

Ala Ala Ala Ala Gly Gly 
785 790 

Gly Gin Gly Ala Gly Gin 

805 

Ala Gly Arg Gly Gly Leu 

820 

Ala Ala Gly Gly Ala Gly 
835 

Gin Gly Ala Gly Ala Ala 



600 

Ala Gly Ala Ala Ala Ala 
615 620 

Gly Gly Leu Gly Gly Gin 

635 

Gly Gly Gin Gly Ala Gly 

650 

Gly Gly Ala Gly Gin Gly 
665 

Gly Arg Gly Gly Gin Gly 
680 

Ala Gly Gin Gly Gly Tyr 
695 700 

Gly Gly Leu Gly Gly Gin 

715 

Gly Ala Gly Gin Gly Gly 

730 

Arg Gly Gly Gin Gly Ala 
745 

Gly Gin Gly Gly Tyr Gly 
760 

Gly Leu Gly Gly Gin Gly 

775 780 

i 

i.: 

Ala Gly Gin ;bly Gly Tyr 

■ * 

795 

Gly Gly Tyr Gly Gly Leu 

810 

Gly Gly Gin Gly Ala Gly 
825 

Gin Gly Gly Leu Gly Gly 
840 

Ala Ala Ala Ala Gly Gly 
30 
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605 

Ala Ala Gly Gly 



Gly Ala Gly Gin 

640 

Gin Gly Ala Gly 
655 

Gly Tyr Gly Gly 
670 

Ala Gly Ala Ala 
685 

Gly Gly Leu Gly 



Gly Ala Gly Ala 

720 

Tyr Gly Gly Leu 

735 

Gly Ala Ala Ala 
750 

Gly Leu Gly Ser 
765 

Ala Gly Ala Ala 



Gly Gly Leu Gly 

800 

Gly Ser Gin Gly 
815 

Ala Ala Ala Ala 
830 

Gin Gly Ala Gly 
845 

Ala Gly Gin Gly 
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855 



860 



Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly 
865 870 875 880 

Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr 

885 890 895 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 

900 905 910 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly 
915 920 925 

Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly 
930 935 940 

Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
945 950 955 960 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 

965 970 975 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 

980 985 990 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
995 1000 1005 

Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
1010 ; 1015 1020 

« 
« 

* i 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 



1025 



1030 



1035 



1040 



i 



Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 

1045 1050 1055 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 

1060 1065 1070 

Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 

1075 1080 1085 

Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly 
1090 1095 1100 

Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly 
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1105 1110 1115 1120 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly 

1125 1130 1135 

Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly 

1140 1145 1150 

Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu 
1155 1160 1165 

Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 
1170 1175 1180 

Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 
1185 1190 1195 1200 

Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 

1205 1210 1215 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 

1220 1225 1230 



Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
1235 1240 1245 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly 
1250 1255 1260 

Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala 
1265 1270 1275 1280 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly 

1285 1290 1295 

Gly Leu Gly Ser Gin Gly Ala Gly Axg Gly Gly Gin Gly Ala Gly Ala 

1300 1305 1310 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 

1315 1320 . . 1325 

j : 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly 
1330 1335 1340 

Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
1345 1350 1355 1360 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala 
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1365 1370 1375 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 

1380 1385 1390 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
1395 1400 1405 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
1410 1415 1420 

Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
1425 1430 1435 1440 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala- Gly Ala Ala Ala 

1445 1450 1455 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala 

1460 1465 1470 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
1475 1480 1485 

Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin 
1490 1495 1500 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
1505 1510 1515 1520 

Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly 

i ; 1525 1530 1535 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala 

1540 1545 1550 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly 
1555 1560 1565 

Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
1570 1575 1580 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
1585 1590 1595 1600 

Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 

1605 1610 1615 

Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 
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1620 1625 1630 

Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
1635 1640 1645 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 
1650 1655 1660 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
1665 1670 1675 1680 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 

1685 1690 1695 

Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 

1700 1705 1710 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
1715 1720 1725 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
1730 1735 1740 

Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr 
1745 1750 1755 1760 

Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin 

1765 1770 1775 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 

1780 1785 1790 

Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
1795 1800 1805 

Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly 
1810 1815 1820 

Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
1825 1830 1835 1840 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 

1845 1850 1855 

Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 

1860 1865 1870 

Gly Gly Ala Gly Gly Gin Ala Ala 
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1875 1880 



<210> 36 
<211> 219 
<212> PRT 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : FA2 -Protein 
<400> 36 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly 

20 25 30 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
35 40 45 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 

85 90 95 

Ala Ala Ala Ala Gly Gly Ala Gly Ser Gly Ser Gly Ala Gly Ala Gly 

100 105 HO 

Ser Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly 
115 120 125 

Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly 
130 135 140 

Tyr Gly Ala Gly Ala Gly Val Gly Tyr Gly Ala Gly Tyr Gly Ala Gly 
145 150 155 160 

Ala Gly Val Gly Tyr Gly Ala Gly Ala Gly Ser Gly Ala Ala Ser Gly 

165 170 175 

Ala Gly Ala Gly Ala Gly Ala Gly Thr Gly Ser Ser Gly Phe Gly Pro 

180 185 190 
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Tyr Val Ala Asn Gly Gly Tyr Ser Gly Tyr Glu Tyr Ala Trp Ser Ser 
195 200 205 

Lys Ser Asp Phe Glu Thr Ala Gly Gin Ala Ala 
210 215 



<210> 37 
<211> 170 
<212> PRT 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : SA1- Protein 
<400> 37 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 

20 25 30 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
35 40 45 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 

85 90 95 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 

100 105 110 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala 
145 150 155 160 

Ala Ala Ala Gly Gly Ala Gly Gin Ala Ala 

165 170 
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<210> 38 
<211> 630 
<212> PRT 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : SOl-Protein 
<400> 38 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
! 5 10 15 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 

20 25 30 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
35 40 45 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

■ 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 

85 90 95 



Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 



100 



105 



110 



Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala 
145 150 155 160 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly 

165 ■ 170 175 

Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 

180 185 190 

Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
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195 200 205 

Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 
210 215 , 220 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
225 230 235 240 

* 

Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala 

245 250 255 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly 

260 265 270 

Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
275 280 285 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
290 295 300 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin 
305 310 315 320 

Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 

325 330 335 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 

340 345 350 

Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
355 360 365 

1 I 
i 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 
370 375 380 

Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 
.385 390 395 400 

Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly 

405 410 415 

Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 

420 425 430 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
435 440 445 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
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450 

Gly Gly Tyr Gly Gly Leu 
465 470 

Gly Ala Gly Ala Ala Ala 

485 

Tyr Gly Gly Leu Gly Gly 

500 

Leu Gly Ser Gin Gly Ala 
515 

Gly Ala Ala Ala Ala Ala 
530 

Gly Gin Gly Ala Gly Gin 
545 550 

Gly Ala Gly Gin Gly Gly 

565 

Arg Gly Gly Gin Gly Ala 

580 

Gly Gin Gly Gly Tyr Gly 
595 

Gly Leu Gly Gly Gin Gly 
610 

Ala Gly Gly Gin Ala Ala 
625 630 



455 460 

Gly Ser Gin Gly Ala Gly 

475 

Ala Ala Ala Gly Gly Ala 

490 

Gin Gly Ala Gly Gin Gly 
505 

Gly Arg Gly Gly Leu Gly 
520 

Ala Gly Gly Ala Gly Gin 
535 540 

Gly Ala Gly Ala Ala Ala 

555 

Tyr Gly Gly Leu Gly Ser 

570 

Gly Ala Ala Ala Ala Ala 
585 

Gly Leu Gly Ser Gin Gly 
600 

Ala Gly Ala Ala Ala Ala 
615 620 
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Arg Gly Gly Gin 

480 

Gly Gin Gly Gly 
495 

Gly Tyr Gly Gly 
510 

Gly Gin Gly Ala 
525 

Gly Gly Leu Gly 



Ala Ala Ala Gly 

560 

Gin Gly Ala Gly 
575 

Ala Gly Gly Ala 
590 

Ala Gly Arg Gly 
605 

Ala Ala Gly Gly 



<210> 39 
<211> 364 
<212> PRT 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : SM12-Protein 
<400> 39 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 
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Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly 

20 25 30 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
35 40 45 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 

85 90 95 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 

100 105 110 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala 
145 150 155 160 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 

165 170 175 

Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 

180 185 190 

Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly 
195 200 205 

Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
210 215 220 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly 
225 230 235 240 

Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly 

245 250 255 

Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 

260 265 270 
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Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 

275 280 285 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
290 295 300 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
305 310 315 320 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 

325 330 335 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 

340 345 350 

Ala Ala Ala Ala Gly Gly Ala Gly Gly Gin Ala Ala 
355 360 



<210> 40 
<211> 271 
<212> PRT 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : SF1 -Protein 
<400> 40 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 

20 25 30 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
35 40 45 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

» 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 

85 90 95 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 

100 105 110 
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Ser Gin Gly Ala Gly Arg 
115 

Ala Ala Gly Gly Ala Gly 
130 

Gly Ala Gly Arg Gly Gly 
145 150 

Ala Ala Ala Gly Gly Ala 

165 

Gin Gly Ala Gly Gin Gly 

180 

Gly Arg Gly Gly Leu Gly 

195 

Ala Gly Gly Ala Gly Gin 
210 

Gly Ala Gly Ala Ala Ala 
225 230 

Tyr Gly Gly Leu Gly Ser 

245 

Gly Ala Ala Ala Ala Ala 

260 



Gly Gly Gin Gly Ala Gly 

120 

Gin Gly Gly Tyr Gly Gly 
135 140 

Leu Gly Gly Gin Gly Ala 

155 

Gly Gin Gly Gly Tyr Gly 

170 

Gly Tyr Gly Gly Leu Gly 
185 

Gly Gin Gly Ala Gly Ala 
200 

Gly Gly Leu Gly Gly Gin 
215 220 

Ala Ala Ala Gly Gly Ala 

235 

Gin Gly Ala Gly Arg Gly 

250 

Ala Gly Gly Ala Gly Gly 
265 



PCT/EP01/06586 

Ala Ala Ala Ala 
125 

Leu Gly Ser Gin 



Gly Ala Ala Ala 

160 

Gly Leu Gly Gly 
175 

Ser Gin Gly Ala 
190 

Ala Ala Ala Ala 

205 

Gly Ala Gly Gin 



Gly Gin Gly Gly 

240 

Gly Gin Gly Ala 
255 

Gin Ala Ala 
270 



<210> 41 
<211> 182 
<212> DNA 

<213> Kunstliehe Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :ELP mit 10 
Pent amereinhei ten 

<400> 41 

ctcgagatgg gccacggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 60 

ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 120 

ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgg gctggcggcc 180 
gc 182 
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<210> 42 

<211> 332 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :ELP mit 20 
Pentaraereinheiten 

<400> 42 

ctcgagatgg gccacggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 60 

ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 120 

ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 180 

ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 240 

ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 3 00 
ggtggcggtg tgccgggcgg gctggcggcc gc 332 



<210> 43 
<211> 482 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :ELP mit 30 
Pentamereinheiten 

<400> 43 

ctcgagatgg gccacggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 60 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 12 0 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 180 
ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 24 0 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 3 00 
ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 360 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 42 0 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgg gctggcggcc, 48 0 
gc 482 



<210> 44 
<211> 632 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :ELP mit 40 
Pent amere i nhe i ten 
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<400> 44 

ctcgagatgg gccacggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 60 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 12 0 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 180 
ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 240 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 300 
ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 360 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 420 
99tggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 480 
ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 540 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 600 
ggtggcggtg tgccgggcgg gctggcggcc gc 632 



<210> 45 

<211> 932 

<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz :ELP mit 60 
Pentamereinheiten 



<400> 45 

ctcgagatgg gccacggcgt gggtgttccg 
ggcgcaggtg ttcctggtgt aggtgtgccg 
ggtggcggtg ttccgggtgc aggcgttccg 
ggcgtgggtg ttccgggtgg cggtgtgccg 
ggtgttggtg tgccgggtgt tggtgtacca 
ggtggcggtg tgccgggcgt gggtgttccg 
ggcgcaggtg ttcctggtgt aggtgtgccg 
ggtggcggtg ttccgggtgc aggcgttccg 
ggcgtgggtg ttccgggtgg cggtgtgccg 
ggtgttggtg tgccgggtgt tggtgtacca 
ggtggcggtg tgccgggcgt gggtgttccg 
ggcgcaggtg; ttcctggtgt aggtgtgccg 
ggtggcggtg ttccgggtgc aggcgttccg 
ggcgtgggtg ttccgggtgg cggtgtgccg 
ggtgttggtg tgccgggtgt tggtgtacca 
ggtggcggtg .tgccgggcgg gctggcggcc 



ggcgtgggtg 


ttccgggtgg 


cggtgtgccg 


60 


ggtgttggtg 


tgccgggtgt 


tggtgtacca 


120 


ggtggcggtg 


tgccgggcgt 


gggtgttccg 


180 


ggcgcaggtg 


ttcctggtgt 


aggtgtgccg 


240 


ggtggcggtg 


ttccgggtgc 


aggcgttccg 


300 


ggcgtgggtg 


ttccgggtgg 


cggtgtgccg 


360 


ggtgttggtg 


tgccgggtgt 


tggtgtacca 


420 


ggtggcggtg 


tgccgggcgt 


gggtgttccg 


480 


ggcgcaggtg 


ttcctggtgt 


aggtgtgccg 


540 


ggtggcggtg 


ttccgggtgc 


aggcgttccg 


600 


ggcgtgggtg 


ttccgggtgg 


cggtgtgccg 


660 


ggtgttggtg 


tgccgggtgt 


tggtgtacca 


720 


ggtggcggtg 


tgccgggcgt 


gggtgttccg 


780 


ggcgcaggtg 


ttcctggtgt 


aggtgtgccg 


840 


ggtggcggtg 


ttccgggtgc 


aggcgttccg 


900 


gc 






932 



<210> 46 
<211> 1082 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

44 
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<223> Beschreibung der kunstlichen Sequenz :ELP mit 70 

Pentamereinheiten 



<400> 46 

ctcgagatgg gccacggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 6 0 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 120 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 180 
ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 240 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 300 
ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 3 60 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 42 0 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 4 80 
ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 54 0 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 60 0 
ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 660 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 720 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 780 
ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 84 0 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 900 
ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 960 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 1020 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgg gctggcggcc 1080 
gc 1082 



<210> 47 
<211> 1532 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :ELP mit 100 
Pentamereinheiten 

<400> 47 

ctcgagatgg gccacggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 60 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 12 0 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 180 
ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 240 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 300 
ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 360 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 420 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 480 
ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 54 0 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 600 
ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 660 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 720 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 780 
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ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 840 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 900 
ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 960 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 1020 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 1080 
ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 1140 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 1200 
ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 1260 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 1320 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 13 80 
ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 1440 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 1500 
ggtggcggtg tgccgggcgg gctggcggcc gc 1532 



<210> 48 
<211> 2322 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : SM12- 7 OxELP 
(Pf lanzen) 

<400> 48 

atggcttcca aaccttttct atctttgctt tcactttcct tgcttctctt tacaagcaca 60 

tgtttagcag gatcccagtt acccgggcag ggaggttatg gtggtctggg gggccagggt 120 

gctggccaag gaggttatgg tggtctgggg agtcagggcg ctggtcgtgg gggactgggt 180 

ggccaaggtg caggagctgc tgctgcagct gcaggtggag ccgggcaggg aggtctggga 240 

gggcagggag cgggccaagg tgcaggagca gctgcagcag ctgcaggtgg agccgggcag 300 

ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 360 

gcaggagcag ctgcagctgc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 420 

agtcagggtg ctggtcgtgg aggccaaggt gcaggagctg cagcagcagc tgcaggtgga 480 

gccgggcagg gaggttatgg tggtctgggg agtcagggcg ctggtcgtgg gggactgggt 540 

ggccaaggtg caggagcagc tgcagctgct gcaggtggag ccgggcaggg aggttatggt 600 

ggtctgggga gtcagggtgc tggtcgtgga ggccaaggtg caggagctgc agcagcagct 660 

gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggtgc tggtcgtgga 720 

ggccaaggtg caggagctgc agcagcagct gcaggtggag ccgggcaggg aggttatggt 780 

ggtctggggg gccagggtgc tggccaagga ggttatggtg gtctggggag tcagggcgct 840 

ggtcgtgggg gactgggtgg ccaaggtgca ggagctgctg. ctgcagctgc aggtggagcc 900 

gggcagggag gtctgggagg gcagggagcg ggccaaggtg caggagcagc tgcagcagct 960 

gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggtgc tggtcgtgga 1020 

ggccaaggtg caggagctgc agcagcagct gcaggtggag ccgggcaggg aggttatggt 108 0 

ggtctgggga gtcagggcgc tggtcgtggg ggactgggtg gccaaggtgc aggagcagct 1140 

gcagctgctg caggtggagc cggcggacaa gcggccgcag aacaaaaact catctcagaa 12 00 

gaggatctga atggggccgt cgagatgggc cacggcgtgg gtgttccggg cgtgggtgtt 1260 

ccgggtggcg gtgtgccggg cgcaggtgtt cctggtgtag gtgtgccggg tgttggtgtg 1320 

ccgggtgttg gtgtaccagg tggcggtgtt ccgggtgcag gcgttccggg tggcggtgtg 13 80* 
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ccgggcgtgg gtgttccggg cgtgggtgtt ccgggtggcg gtgtgccggg cgcaggtgtt 1440 

cctggtgtag gtgtgccggg tgttggtgtg ccgggtgttg gtgtaccagg tggcggtgtt 1500 

ccgggtgcag gcgttccggg tggcggtgtg ccgggcgtgg gtgttccggg cgtgggtgtt 1560 

ccgggtggcg gtgtgccggg cgcaggtgtt cctggtgtag gtgtgccggg tgttggtgtg 1620 

ccgggtgttg gtgtaccagg tggcggtgtt ccgggtgcag gcgttccggg tggcggtgtg 1680 

ccgggcgtgg gtgttccggg cgtgggtgtt ccgggtggcg gtgtgccggg cgcaggtgtt 1740 

cctggtgtag gtgtgccggg tgttggtgtg ccgggtgttg gtgtaccagg tggcggtgtt 1800 

ccgggtgcag gcgttccggg tggcggtgtg ccgggcgtgg gtgttccggg cgtgggtgtt 1860 

ccgggtggcg gtgtgccggg cgcaggtgtt cctggtgtag gtgtgccggg tgttggtgtg 192 0 

ccgggtgttg gtgtaccagg tggcggtgtt ccgggtgcag gcgttccggg tggcggtgtg 1980 

ccgggcgtgg gtgttccggg cgtgggtgtt ccgggtggcg gtgtgccggg cgcaggtgtt 204 0 

cctggtgtag gtgtgccggg tgttggtgtg ccgggtgttg gtgtaccagg tggcggtgtt 2100 

ccgggtgcag gcgttccggg tggcggtgtg ccgggcgtgg gtgttccggg cgtgggtgtt 2160 

ccgggtggcg gtgtgccggg cgcaggtgtt cctggtgtag gtgtgccggg tgttggtgtg 2220 

ccgggtgttg gtgtaccagg tggcggtgtt ccgggtgcag gcgttccggg tggcggtgtg 22 8 0 

ccgggcgggc tggcggccgc agaacccaaa gacgaactct ag 2322 



<210> 49 
<211> 773 
<212> PRT 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :SM12- 7 OxELP 
(Pf lanzen) 

<400> 49 

Met Ala Ser Lys Pro Phe Leu Ser Leu Leu Ser Leu Ser Leu Leu Leu 
15 10 15 

Phe Thr Ser Thr Cys Leu Ala Gly Ser Gin Leu Pro Gly Gin Gly Gly 

20 25 30 

Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
35 40 45 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala 
50 55 60 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly 
65 70 75 80 

Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 

85 90 95 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 

100 105 110 • 
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Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 
115 120 125 

Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 
130 135 140 

Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
145 150 155 160 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 

165 170 175 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 

180 185 190 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
195 200 205 

Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
210 215 220 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
225 230 235 240 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 

245 250 255 

Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr 

260 265 270 

Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly' Leu Gly Gly Gin 
275 280 285 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
290 295 300 

Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
305 310 315 320 

Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly 

325 330 335 

Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 

340 345 350 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
355 360 365 

48 



SOOCID: <WO 0194393A2. 1_> 



* » r , 



WO 01/94393 PCT/EP01/06586 

Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 
370 375 380 

Gly Gly Ala Gly Gly Gin Ala Ala Ala Glu Gin Lys Leu He Ser Glu 

385 390 395 400 

Glu Asp Leu Asn Gly Ala Val Glu Met Gly His Gly Val Gly Val Pro 

405 410 415 

Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly 

420 425 430 

Val Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly 
435 440 445 

Gly Val Pro' Gly Ala Gly Val Pro Gly Gly Gly Val Pro Gly Val Gly 
450 455 460 

Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val 
465 470 475 480 

Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro 

485 490 495 

Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly Gly Gly Val Pro Gly 

500 505 510 

Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala 
515 520 . i 525 

! i 
. i 

Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Val Gly 
530 535 : 540 

Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly Gly Gly Val 
545 550 555 ' ; ; 560 

Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro 

565 570 575 

Gly Ala Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly 

580 585 590 

Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly Gly 
595 600 605 

Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly 
610 615 620 
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Val Pro Gly Ala Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val 
625 630 635 640 

Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro 

645 650 655 

Gly Gly Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly 

m 

660 665 670 

Gly Gly Val Pro Gly Ala Gly Val Pro Gly Val Gly Val Pro Gly Val 
675 680 685 

Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly 
690 695 700 



Val Pro Gly Gly Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val 
705 710 715 720 

Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly Val Gly Val Pro 

725 730 735 

Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly 

740 745 750 

Ala Gly Val Pro Gly Gly Gly Val Pro Gly Gly Leu Ala Ala Ala Glu 
755 760 765 



Pro Lys Asp Glu Leu 
770 



<210> 50 

<211> 2334 

<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz :SM12- 7 OxELP 
(E.coli) 



<400> 50 

atggctagca tgactggtgg acagcaaatg ggtcgcggat cccagttacc cgggcaggga 6 0 
ggttatggtg gtctgggggg ccagggtgct ggccaaggag gttatggtgg tctggggagt 120 
cagggcgctg gtcgtggggg actgggtggc caaggtgcag gagctgctgc tgcagctgca 180 
ggtggagccg ggcagggagg tctgggaggg cagggagcgg gccaaggtgc aggagcagct 24 0 
gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggcgct 3 00 
ggtcgtgggg. gactgggtgg ccaaggtgca ggagcagctg cagctgctgc aggtggagcc 360 
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gggcagggag gttatggtgg tctggggagt cagggtgctg gtcgtggagg ccaaggtgca 420 

ggagctgcag cagcagctgc aggtggagcc gggcagggag gttatggtgg tctggggagt 480 

cagggcgctg gtcgtggggg actgggtggc caaggtgcag gagcagctgc agctgctgca 54 0 

ggtggagccg ggcagggagg ttatggtggt ctggggagtc agggtgctgg tcgtggaggc 600 

caaggtgcag gagctgcagc agcagctgca ggtggagccg ggcagggagg ttatggtggt 660 

ctggggagtc agggtgctgg tcgtggaggc caaggtgcag gagctgcagc agcagctgca 720 

ggtggagccg ggcagggagg ttatggtggt ctggggggcc agggtgctgg ccaaggaggt 780 

tatggtggtc tggggagtca gggcgctggt cgtgggggac tgggtggcca aggtgcagga 84 0 

gctgctgctg cagctgcagg tggagccggg cagggaggtc tgggagggca gggagcgggc 900 

caaggtgcag gagcagctgc agcagctgca ggtggagccg ggcagggagg ttatggtggt 960 

ctggggagtc agggtgctgg tcgtggaggc caaggtgcag gagctgcagc agcagctgca 102 0 

ggtggagccg ggcagggagg ttatggtggt ctggggagtc agggcgctgg tcgtggggga 1080 

ctgggtggcc aaggtgcagg agcagctgca gctgctgcag gtggagccgg cggacaagcg 1140 

gccgcagaac aaaaactcat ctcagaagag gatctgaatg gggccgtcga gatgggccac 1200 

ggcgtgggtg ttccgggcgt gggtgttccg ggtggcggtg tgccgggcgc aggtgttcct 1260 

ggtgtaggtg tgccgggtgt tggtgtgccg ggtgttggtg taccaggtgg cggtgttccg 1320 

ggtgcaggcg ttccgggtgg cggtgtgccg ggcgtgggtg ttccgggcgt gggtgttccg 1380 

ggtggcggtg tgccgggcgc aggtgttcct ggtgtaggtg tgccgggtgt tggtgtgccg 1440 

ggtgttggtg taccaggtgg cggtgttccg ggtgcaggcg ttccgggtgg cggtgtgccg 1500 

ggcgtgggtg ttccgggcgt gggtgttccg ggtggcggtg tgccgggcgc aggtgttcct 1560 

ggtgtaggtg tgccgggtgt tggtgtgccg ggtgttggtg taccaggtgg cggtgttccg 162 0 

ggtgcaggcg ttccgggtgg cggtgtgccg ggcgtgggtg ttccgggcgt gggtgttccg 1680 

ggtggcggtg tgccgggcgc aggtgttcct ggtgtaggtg tgccgggtgt tggtgtgccg 1740 

ggtgttggtg taccaggtgg cggtgttccg ggtgcaggcg ttccgggtgg cggtgtgccg 1800 

ggcgtgggtg ttccgggcgt gggtgttccg ggtggcggtg tgccgggcgc aggtgttcct 1860 

ggtgtaggtg tgccgggtgt tggtgtgccg ggtgttggtg taccaggtgg cggtgttccg 1920 

ggtgcaggcg ttccgggtgg cggtgtgccg ggcgtgggtg ttccgggcgt gggtgttccg 1980 

ggtggcggtg tgccgggcgc aggtgttcct ggtgtaggtg tgccgggtgt tggtgtgccg 2040 

ggtgttggtg taccaggtgg cggtgttccg ggtgcaggcg ttccgggtgg cggtgtgccg 2100 

ggcgtgggtg ttccgggcgt gggtgttccg ggtggcggtg tgccgggcgc aggtgttcct 2160 

ggtgtaggtg tgccgggtgt tggtgtgccg ggtgttggtg taccaggtgg cggtgttccg 222 0 

ggtgcaggcg ttccgggtgg cggtgtgccg ggcgggctgg cggccgcaga acaaaaactc 2280 

atctcagaag aggatctgaa tggggccgtc gagcaccacc accaccacca ctga 2334 



<210> 51 
<211> 777 
<212> PRT 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : SM12-70xELP 
(E. coli) 

<400> 51 

Met Ala Ser Met Thr Gly Gly Gin Gin Met Gly Arg Gly Ser Gin Leu 
15 10 15 
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Pro Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 

20 25 30 

Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu 
35 40 45 

Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 
50 55 60 

Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala 
65 70 75 80 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 

85 90 95 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 

100 105 110 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
115 120 125 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
130 135 140 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
145 150 155 160 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 

165 170 175 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 

180 185 190 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
195 200 205 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
210 215 220 

Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 
225 230 235 240 

Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala 

245 250 255 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser. Gin Gly Ala Gly Arg Gly 

260 265 270 
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Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 

275 280 285 

Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly 
290 295 300 

Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
305 310 315 320 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala 

325 330 335 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 

340 345 350 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
355 360 365 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gly Gin Ala Ala Ala Glu Gin 
370 375 380 

Lys Leu lie Ser Glu Glu Asp Leu Asn Gly Ala Val Glu Met Gly His 
385 390 395 400 

Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly 

405 410 415 

Ala Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Val 

420 425 430 

Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly Gly Gly 
435 440 445 

Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val 
450 455 460 

Pro Gly Ala Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro 
465 470 475 480 

Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly 

485 490 495 

Gly Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly 

500 505 510 

Gly Val Pro Gly Ala Gly Val Pro Gly Val Gly Val Pro Gly Val Gly 
515 520 525 
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Val Pro Gly Val Gly Val 
530 

Pro Gly Gly Gly Val Pro 
545 550 

Gly Gly Gly Val Pro Gly 

565 

Val Gly Val Pro Gly Val 

580 

Gly Val Pro Gly Gly Gly 
595 

Val Pro Gly Gly Gly Val 
610 

Pro Gly Val Gly Val Pro 
625 630 

Gly Ala Gly Val Pro Gly 

645 

Val Gly Val Pro Gly Gly 

660 

Gly Val Pro Gly Val Gly 
675 

Val Pro Gly Ala Gly Val 
690 

Pro Gly Val Gly Val Pro 
705 710 

Gly Val Gly Val Pro Gly 

725 

Gly Gly Val Pro Gly Ala 

740 

Leu Ala Ala Ala Glu Gin 
755 

Ala Val Glu His His His 
770 



Pro Gly Gly Gly Val Pro 
535 540 

Gly Val Gly Val Pro Gly 

555 

Ala Gly Val Pro Gly Val 

570 

Gly Val Pro Gly Gly Gly 
585 

Val Pro Gly Val Gly Val 
600 

Pro Gly Ala Gly Val Pro 
615 620 

Gly Val Gly Val Pro Gly 

635 

Gly Gly Val Pro Gly Val 

650 

Gly Val Pro Gly Ala Gly 
665 

Val Pro Gly Val Gly Val 
680 

Pro Gly Gly Gly Val Pro 
695 700 

Gly Gly Gly Val Pro Gly 

715 

Val Gly Val Pro Gly Val 

730 

Gly Val Pro Gly Gly Gly 
745 

Lys Leu lie Ser Glu Glu 
760 

His His His 
775 
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Gly Ala Gly Val 

Val Gly Val Pro 

560 

Gly Val Pro Gly 
575 

Val Pro Gly Ala 
590 

Pro Gly Val Gly 
605 

■ 

Gly Val Gly Val 

Gly Gly Val Pro 

640 

Gly Val Pro Gly 
655 

Val Pro Gly Val 
670 

Pro Gly Gly Gly 
685 

Gly Val Gly Val 



Ala Gly Val Pro 

720 

Gly Val Pro Gly 
735 

Val Pro Gly Gly 
750 

Asp Leu Asn Gly 
765 
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